Come la Ricerca organizza le informazioni

Prima di fare una ricerca, i web crawler raccolgono informazioni da centinaia di miliardi di pagine web e le organizzano nell'indice di ricerca.

Le basi della Ricerca

Il processo di scansione inizia con un elenco di indirizzi web da scansioni precedenti e da Sitemap fornite dai proprietari di siti web. Quando i nostri crawler visitano questi siti web, utilizzano i link presenti per scoprire altre pagine. Il software pone particolare attenzione ai nuovi siti, alle modifiche ai siti esistenti e ai link obsoleti. I programmi per computer determinano quali siti scansionare, la frequenza e quante pagine riportare da ciascun sito.

Con gli strumenti per i webmaster offriamo ai proprietari di siti diverse scelte riguardo il metodo usato da Google per la scansione del loro sito: possono fornire istruzioni dettagliate su come elaborare le pagine dei siti, possono richiedere una nuova scansione oppure disattivare del tutto la scansione grazie a un file chiamato "robots.txt". Google non accetta mai pagamenti per eseguire una scansione più frequente di un sito. Forniamo gli stessi strumenti a tutti i siti web per garantire agli utenti i migliori risultati possibili.

Trovare informazioni tramite la scansione

Il Web è come una biblioteca in continua espansione, con miliardi di libri e senza alcun sistema di archiviazione centrale. Utilizziamo software noti come web crawler per scoprire le pagine disponibili al pubblico. I crawler guardano le pagine web e seguono i link presenti, come farebbe un utente che esplora i contenuti sul Web. Passano da un link all'altro e riportano i dati relativi a quelle pagine web ai server di Google.

Organizzare le informazioni tramite l'indicizzazione

Quando i crawler trovano una pagina web, i nostri sistemi visualizzano i contenuti della pagina come farebbe il browser. Prendiamo nota dei segnali chiave, dalle parole chiave alla data di aggiornamento del sito web, e teniamo traccia di tutto nell'indice di ricerca.

L'indice della Ricerca Google contiene centinaia di miliardi di pagine web e le sue dimensioni superano i 100.000.000 di gigabyte. È come l'indice alla fine di un libro, con una voce per ogni parola visualizzata su ciascuna pagina web che indicizziamo. Quando indicizziamo una pagina web, la aggiungiamo alle voci per tutte le parole che contiene.

 

 

Con il Knowledge Graph, continuiamo ad andare oltre la corrispondenza delle parole chiave per avere una migliore comprensione delle persone, dei luoghi e delle cose che ti interessano. Per farlo organizziamo le informazioni riguardanti le pagine web, ma anche altri tipi di informazioni. Ora la Ricerca Google può aiutarti a cercare del testo tra milioni di libri provenienti dalle maggiori raccolte, a trovare orari di viaggio tramite la tua azienda di trasporto pubblico locale e a raggiungere dati forniti da fonti pubbliche come la Banca mondiale.