miércoles, 9 de junio de 2010

Google acelera con Caffeine

3788858


El gigante de internet Google anunció oficialmente su nueva arquitectura de indexación de páginas web bautizada Caffeine, implementado en su motor de búsqueda y que le permite aumentar la velocidad, tamaño y precisión de los resultados.

Caffeine fue implementado por Google desde finales del año pasado, cuando el buscador comenzó a desplegar búsquedas con un bloque de herramientas sobre imágenes, noticias, videos, blogs, foros, mapas y libros relacionados a las búsquedas. También ampliaba y contextualizaba la información con búsquedas similares y búsquedas por términos en una línea de tiempo.

Según Google, el sistema de indexado web Caffeine ofrece resultados 50 por ciento más actualizados que su índice anterior. Además permite manejar la cantidad masiva de datos que se generan constantemente en internet, no sólo de páginas web sino también de videos, imágenes, noticias y actualizaciones en tiempo real como tweets.
Google asegura que cada segundo Caffeine procesa cientos de miles de páginas de manera paralela.
"Caffeine ocupa 100 millones de gigabytes de almacenamiento en una base de datos y añade nueva información a una velocidad de cientos de miles de gigabytes por día", explicó Carrie Grimes, ingeniero de software en Google, en un mensaje publicado en el blog oficial de la compañía.

Caffeine es ejemplificado por Google mediante una imagen que compara ambas arquitecturas. Su índice anterior contenía diferentes capas categorizadas por importancia, donde algunas se actualizaban más rápido que otras. La capa principal se refrescaba cada par de semanas, y para actualizar un nivel Google debía analizar toda la web, proceso que demoraba la entrega de nuevos resultados.

En el nuevo diagrama, Caffeine analiza la Red en pequeñas porciones y actualiza el índice de búsquedas constantemente y de manera global. Además el sistema añade nuevos contenidos conforme Google encuentra nuevas páginas o información añadida a sitios ya existentes.

Para comparar la enorme cantidad de datos que manejan, Google ejemplifica a Caffeine como una pila de papeles que aumenta su altura tres millas cada segundo. Otra equivalencia es que se requerirían 625 mil de los iPods con mayor capacidad para almacenar tal cantidad de datos, y que colocados uno junto a otro formarían una línea de más de 40 millas de exntesión.

No hay comentarios

No te lo puedes perder

© Planeta digital
Maira Gall