Jak Vyhledávání třídí informace

Abychom vám vyhledávání mohli nabízet, shromažďují prohledávače informace ze stovek miliard webových stránek a třídí je do indexu Vyhledávání.

Základní princip Vyhledávání

Proces procházení začíná se seznamem webových adres z minulých vyhledávání a mapami webů, které nám poskytli jejich vlastníci. Prohledávače uvedené stránky navštíví a pomocí odkazů na nich objevují další stránky. Software věnuje zvláštní pozornost novým webům, změnám na stávajících webech a nefunkčním odkazům. Počítačové programy určují, které weby se mají procházet, jak často se mají procházet a kolik stránek se má z každého webu načíst.

Nabízíme nástroje pro webmastery, pomocí kterých mohou vlastníci webů přesně určit, jak má Google jejich web procházet. Mohou například poskytnout podrobné pokyny ke zpracování stránek, požádat o opětovné projití nebo se z procházení zcela odhlásit pomocí souboru robots.txt. Společnost Google nepřijímá platby za častější procházení konkrétního webu – abychom uživatelům zajistili co nejlepší výsledky, poskytujeme všem webům stejné nástroje.

Objevování informací procházením

Internet se podobá neustále se rozrůstající knihovně s miliardami knih bez centrálního katalogu. K objevení veřejně dostupných webových stránek používáme softwarové programy, tzv. prohledávače. Prohledávače se dívají na webové stránky a následují odkazy na nich, podobně jako to při procházení webu děláte vy. Přecházejí z odkazu na odkaz a údaje o navštívených webech přenášejí na servery Google.

Třídění informací indexováním

Když prohledávače najdou webovou stránku, naše systémy její obsah vykreslí podobně, jako to dělá prohlížeč. Vyhodnotíme důležité signály – od klíčových slov až po stáří webu – a to vše zaznamenáme do indexu Vyhledávání.

Index Vyhledávání Google obsahuje stovky miliard webových stránek a má hodně přes 100 000 000 gigabajtů. Podobá se rejstříku na konci knihy – obsahuje záznamy pro všechna slova, na která jsme na indexovaných webech narazili. Web při indexování přidáme k záznamům pro všechna slova, která obsahuje.

 

 

Prostřednictvím Diagramu znalostí se snažíme rozšířit naše chápání lidí, míst a věcí nad rámec pouhého porovnávání slov. Za tímto účelem třídíme kromě obsahu z webových stránek také další typy informací. V současné době vám Vyhledávání Google dokáže vyhledat text z milionů knih z nejvýznamnějších knihoven, najít spojení místní veřejnou dopravou nebo procházet data z veřejných zdrojů, jako je například Světová banka.