Como a Pesquisa organiza informações

Antes de você pesquisar, os rastreadores da Web coletam informações de centenas de bilhões de páginas e organizam essas informações no índice da Pesquisa.

Princípios fundamentais da Pesquisa

O processo de rastreamento começa com uma lista de endereços da Web de rastreamentos anteriores e sitemaps fornecidos pelos proprietários dos sites. Quando nossos rastreadores acessam esses sites, os links deles são usados para encontrar outras páginas. O software se concentra principalmente nos sites novos, nas alterações de sites existentes e nos links inativos. Usamos programas de computador para determinar quais sites serão rastreados, com que frequência e quantas páginas buscaremos em cada site.

Oferecemos ferramentas para webmasters de modo que os proprietários de sites tenham opções granulares sobre como o Google faz o rastreamento: eles podem fornecer instruções detalhadas sobre como processar as páginas nos sites deles, solicitar um novo rastreamento ou desativar totalmente esse processo por meio de um arquivo chamado robots.txt. O Google nunca aceita pagamentos para rastrear sites com mais frequência. Oferecemos as mesmas ferramentas para todos os sites a fim de garantir os melhores resultados possíveis para nossos usuários.

Localização de informações com o rastreamento

A Web é como uma biblioteca que não para de crescer, com bilhões de livros e sem um sistema central de catálogo. Usamos softwares conhecidos como rastreadores da Web para detectar as páginas disponíveis ao público. Os rastreadores analisam as páginas e seguem os links delas, da mesma forma que você faria se estivesse navegando pelo conteúdo na Web. Eles vão de link em link e levam dados sobre essas páginas para os servidores do Google.

Organização de informações com a indexação

Quando os rastreadores encontram uma página da Web, nossos sistemas processam o conteúdo da página da mesma forma que um navegador. Detectamos os sinais importantes, como as palavras-chave e a idade do conteúdo do site, e registramos tudo isso no índice da Pesquisa.

O índice da Pesquisa Google contém centenas de bilhões de páginas da Web e tem mais de cem milhões de gigabytes de tamanho. Ele funciona como o índice remissivo dos livros, com uma entrada para cada palavra vista em todas as páginas da Web indexadas. Quando indexamos uma página da Web, adicionamos essa página às entradas correspondentes a todas as palavras dela.

Com o Mapa do conhecimento, continuamos indo além da correspondência de palavra-chave para entender melhor as pessoas, os lugares e as coisas mais importantes para você. Para fazer isso, organizamos dados sobre páginas da Web, mas também outros tipos de informações. Atualmente, a Pesquisa do Google pode ajudar você a pesquisar textos em milhões de livros de grandes bibliotecas, ver os tempos de deslocamento fornecidos pelo departamento de trânsito local ou navegar nos dados de fontes públicas, como o Banco Mundial.