Cómo organiza la información la Búsqueda

Antes de que hagas una búsqueda, los rastreadores web recogen la información de cientos de miles de millones de páginas web y la organizan en el índice de la Búsqueda.

Conceptos básicos de la Búsqueda

El proceso de rastreo empieza con una lista de direcciones web de anteriores rastreos y con los sitemaps que nos proporcionan los propietarios de sitios web. Al visitarlos, los rastreadores siguen los enlaces que encuentran para descubrir otras páginas y prestan una atención especial a los sitios web nuevos, a los cambios en los actuales y a los enlaces obsoletos. Los sitios web que deben rastrearse, la frecuencia de dichos rastreos y el número de páginas que hay que explorar se determinan mediante programas informáticos.

Ofrecemos herramientas para webmasters con las que los propietarios de sitios web toman decisiones granulares sobre cómo debe Google rastrear su sitio web. Pueden dar instrucciones detalladas sobre cómo procesar sus páginas, solicitar que las vuelvan a rastrear o inhabilitar el rastreo mediante un archivo denominado “robots.txt”. En Google no aceptamos pagos por rastrear un sitio web con más frecuencia. Ofrecemos las mismas herramientas a todos los sitios web para asegurarnos de que nuestros usuarios obtienen los mejores resultados posibles.

Encontrar información mediante el rastreo

Internet es como una biblioteca en crecimiento constante con miles de millones de libros, pero sin ningún archivo central. Para encontrar páginas web públicas, utilizamos unos programas denominados rastreadores web que las analizan y siguen los enlaces que contienen, igual que lo haría un usuario. Van de un enlace a otro y transmiten los datos de estas páginas web a los servidores de Google.

Organizar la información al indexarla

Cuando los rastreadores encuentran una página web, nuestros sistemas procesan su contenido igual que un navegador; tomamos como referencia los indicadores clave (desde palabras clave hasta la tasa de actualización) y realizamos un seguimiento de todos estos datos en el índice de la Búsqueda.

El índice de la Búsqueda de Google contiene cientos de miles de millones de páginas web que, juntas, superan los 100.000.000 gigabytes. Es similar al índice de las últimas páginas de un libro: dispone de una entrada para cada palabra de cada página web que indexamos. Al indexar una página web, añadimos al índice todas las palabras que contiene.

Con el gráfico de conocimiento, intentamos ir más allá de la concordancia con palabras clave para tratar de comprender qué personas, lugares y cosas te importan. Para conseguirlo, no solo organizamos la información de las páginas web, sino que también tenemos en cuenta otro tipo de información. Actualmente, la Búsqueda de Google te ayuda a buscar textos de millones de libros de las bibliotecas más importantes, a saber los tiempos de desplazamiento de las empresas de transporte público local o a navegar por los datos de fuentes públicas de conocimiento, como el Banco Mundial.