Как Търсене организира информацията

Преди да извършите търсене, уеб роботите събират информация от стотици милиарди уеб страници и я организират в индекса на Търсене.

Основи на търсенето

Обхождането започва със списък от уеб адреси от минали обхождания и със Sitemap, предоставени от собствениците на уебсайтове. Когато роботите ни посещават тези сайтове, използват връзките в тях, за да откриват други страници. Софтуерът обръща специално внимание на нови сайтове, промени в съществуващите сайтове и неработещи връзки. Компютърни програми определят кои сайтове и колко често да бъдат обхождани, както и колко страници да бъдат извлечени от всеки от тях.

Предлагаме инструменти за уеб администратори, за да предоставим на собствениците на сайтове възможности да прецизират начина, по който Google обхожда съдържанието им. Те могат да предоставят подробни инструкции за това, как да се обработват страниците на сайтовете им, да подадат молба за повторно обхождане или да се откажат изцяло от обхождането, като използват файл на име robots.txt. Google никога не приема плащане с цел по-често обхождане на даден сайт – предоставяме едни и същи инструменти на всички уебсайтове, за да гарантираме възможно най-добрите резултати за потребителите си.

Намиране на информация чрез обхождане

Мрежата е като библиотека с милиарди книги, която няма централна система за картотекиране и постоянно расте. Използваме софтуер, познат като уеб роботи, за да откриваме общодостъпни уеб страници. Той преглежда страниците и отваря връзките в тях, подобно на начина, по който вие разглеждате съдържание в мрежата. Роботите обхождат отделните връзки и връщат данни за съответните уеб страници в сървърите на Google.

Организиране на информацията чрез индексиране

Когато роботите намерят уеб страница, системите ни изобразяват съдържанието й, точно както правят браузърите. Обръщаме внимание на основни сигнали – от ключови думи до актуалност на уебсайта – и ги следим в индекса на Търсене.

Индексът на Google Търсене съдържа стотици милиарди уеб страници и е с размер над 100 000 000 гигабайта. Подобно на индекса в края на книга, в него има запис за всяка дума, срещната във всяка индексирана от нас уеб страница. Когато индексираме дадена страница, ние я добавяме към записите за всички думи, които съдържа.

 

 

Графът на знанието е поредната ни стъпка отвъд търсенето на съответстващи ключови думи в опита ни да разберем по-добре хората, местата и нещата, които ви интересуват. За целта организираме не само информацията за уеб страниците, но и други типове данни. Днес с помощта на Google Търсене можете да намирате текст от милиони книги от големи библиотеки, разписания от местната агенция за обществен транспорт или данни от обществени източници, като Световната банка.