Ako fungujú vyhľadávacie algoritmy

Na internete sa nachádza obrovské množstvo informácií a nájdenie tých potrebných by bolo takmer nemožné, keby vám niekto nepomohol s ich usporiadaním. Presne na to slúžia hodnotiace systémy Googlu, ktoré prechádzajú stovky miliárd webových stránok a pridávajú ich do indexu Vyhľadávania, aby vám za zlomok sekundy mohli poskytnúť užitočné a relevantné výsledky. Zároveň vám ich prezentujú spôsobom, ktorý vám pomôže nájsť to, čo hľadáte.

Tieto hodnotiace systémy pozostávajú z niekoľkých sérií algoritmov. Algoritmy Vyhľadávania posudzujú mnoho faktorov vrátane slov v dopyte, relevancie a použiteľnosti stránok, odbornosti zdrojov a vašej polohy a nastavení, aby vám poskytli tie najužitočnejšie informácie. Dôraz kladený na každý faktor závisí od povahy vášho dopytu. Čerstvosť obsahu má napríklad väčší význam pri odpovedaní na dopyty týkajúce sa aktuálnych spravodajských tém ako v prípade definícií zo slovníka.

Na zaistenie toho, aby algoritmy Vyhľadávania spĺňali tie najvyššie štandardy relevancie a kvality, používame dôsledný proces zahrnujúci živé testovanie a tisícky vyškolených externých hodnotiteľov kvality Vyhľadávania po celom svete. Títo hodnotitelia kvality prísne dodržiavajú verejné pokyny, ktoré definujú naše ciele pre algoritmy Vyhľadávania.

Nižšie nájdete ďalšie informácie o kľúčových faktoroch pomáhajúcich určiť, ktoré výsledky sa vrátia pre váš dopyt:

  • Analýza vašich slov

    Analýza vašich slov

    Porozumenie významu vášho vyhľadávania je rozhodujúce pre vrátenie dobrých odpovedí. Pri vyhľadávaní stránok s relevantnými informáciami preto ako prvé analyzujeme význam slov vo vyhľadávacom dopyte. Vytvárame jazykové modely, pomocou ktorých sa pokúšame dešifrovať, ktoré reťazce slov by sme mali hľadať v indexe.

    Zahrnuje to kroky, ktoré sú zdanlivo jednoduché, ako je napríklad interpretácia pravopisných chýb, a pokračuje to snahou pochopiť, aký typ dopytu ste zadali, a to použitím najnovších poznatkov z výskumu prirodzeného jazyka. Náš synonymický slovník napríklad pomáha Vyhľadávaniu zistiť, čo dopytom myslíte, a to aj vtedy, ak má slovo viacero definícií. Vývoj tohto systému trval viac ako päť rokov a významne zlepšuje výsledky pre viac ako 30 % vyhľadávaní vo všetkých jazykoch.

    Snažíme sa tiež porozumieť tomu, akú kategóriu informácií hľadáte. Ide o veľmi špecifické vyhľadávanie alebo široký dopyt? Vyskytujú sa v ňom slová, ako napríklad „recenzia“, „fotky“ alebo „otváracie hodiny“, ktoré naznačujú, že hľadáte konkrétne informácie? Hľadáte populárne kľúčové slová, ktoré znamenajú, že požadujete obsah zverejnený v daný deň? Alebo hľadáte firmu v okolí a chcete miestne informácie?

  • Hľadanie zhôd vyhľadávania

    Hľadanie zhôd vyhľadávania

    Potom hľadáme webové stránky s informáciami, ktoré zodpovedajú vášmu dopytu. Zjednodušene povedané, počas vyhľadávania hľadajú algoritmy vyhľadávacie dopyty v indexe, a tak nájdu príslušné stránky. Analyzujú, ako často a kde sa tieto kľúčové slová vyskytujú na stránke, či už v názvoch, nadpisoch alebo v hlavnom texte.

    Okrem vyhľadávania zodpovedajúcich kľúčových slov hľadajú algoritmy aj stopy na meranie toho, do akej miery poskytujú potenciálne výsledky vyhľadávania používateľom to, čo hľadajú. Keď vyhľadáte dopyt „psy“, zrejme nechcete stránku, na ktorej sa slovo „psy“ nachádza viac ako stokrát. Snažíme sa zistiť, či daná stránka obsahuje odpoveď na váš dopyt, a nie to, či sa na nej tento dopyt iba dookola opakuje. Vyhľadávacie algoritmy preto analyzujú, či stránky zahrnujú relevantný obsah – napríklad obrázky psov, videá alebo dokonca zoznam plemien. Na záver skontrolujeme, či je stránka napísaná v rovnakom jazyku ako vaša otázka, aby sme uprednostnili stránky vo vašom preferovanom jazyku.

  • Hodnotenie užitočných stránok

    Hodnotenie užitočných stránok

    Pre obvyklý dopyt sú k dispozícii tisícky, dokonca aj milióny webových stránok s potenciálne relevantnými informáciami. Takže na to, aby sme pomohli najlepším stránkam zaradiť sa ako prvé, programujeme taktiež algoritmy na hodnotenie ich užitočnosti.

    Tieto algoritmy analyzujú stovky rôznych faktorov, aby sa pokúsili nájsť tie najlepšie informácie, ktoré dokáže internet ponúknuť, od aktuálnosti obsahu, po počet výskytov vyhľadávacích dopytov a údaje o tom, či majú používatelia zo stránky dobrý dojem. Na to, aby sme mohli posúdiť dôveryhodnosť a spoľahlivosť obsahu, hľadáme weby, ktoré mnohí používatelia oceňujú v prípade podobných dopytov. Ak na príslušnú stránku s požadovaným obsahom odkazujú aj ďalšie významné weby, ide o dobré znamenie, že informácie sú kvalitné.

    Na webe sa nachádza veľa spamových stránok, ktoré sa pokúšajú nekalo prebojovať na prvé priečky výsledkov vyhľadávania prostredníctvom techník, ako je opakované používanie rovnakých kľúčových slov či nakupovanie odkazov, ktoré vyhovujú hodnoteniu PageRank. S týmito webmi majú používatelia Google veľmi zlé skúsenosti a môžu im dokonca uškodiť, prípadne ich zavádzať. Preto programujeme algoritmy, ktoré identifikujú spam a odstraňujú weby porušujúce pokyny pre správcov webu od Googlu z našich výsledkov.

  • Zobrazovanie najlepších výsledkov

    Zobrazovanie najlepších výsledkov

    Pred zobrazením výsledkov zhodnotíme, ako všetky relevantné informácie do seba zapadajú: je medzi výsledkami vyhľadávania iba jedna téma alebo niekoľko? Zameriava sa na jednu úzku interpretáciu príliš veľa stránok? Snažíme sa poskytnúť rôznorodý súbor informácií vo formátoch, ktoré sú najužitočnejšie pre váš typ vyhľadávania. A s vývojom internetu vyvíjame aj systémy hodnotenia, aby sme dosiahli lepšie výsledky pre viac dopytov.

  • Používanie kontextu

    Používanie kontextu

    Informácie, ako sú vaša poloha, predchádzajúca história vyhľadávania a nastavenia Vyhľadávania, nám pomáhajú prispôsobiť výsledky tomu, čo je pre vás v danom momente najužitočnejšie a najrelevantnejšie.

    Vašu krajinu a polohu používame na poskytovanie obsahu, ktorý je relevantný pre vašu oblasť. Ak sa napríklad nachádzate v Chicagu a vyhľadáte dopyt „futbal“, Google vám pravdepodobne najprv zobrazí výsledky o americkom futbale a tíme Chicago Bears. Ak však vyhľadáte dopyt „futbal“ v Londýne, Google na prvých priečkam zobrazí výsledky o klasickom futbale a lige Premier League. Nastavenia Vyhľadávania sú tiež dôležitým indikátorom toho, ktoré výsledky budú pre vás pravdepodobne užitočné, ak napríklad nastavíte preferovaný jazyk či aktivujete Bezpečné vyhľadávanie (nástroj na filtrovanie explicitných výsledkov).

    V niektorých prípadoch môžeme výsledky prispôsobiť aj pomocou informácií o vašej nedávnej aktivite Vyhľadávania. Ak napríklad vyhľadáte výraz „Barcelona“, pričom ste nedávno hľadali dopyt „Barcelona v. Arsenal”, môže to byť dôležitá stopa, že chcete nájsť informácie o futbalovom klube, nie meste. Na adrese myaccount.google.com môžete ovládať, ktorá vyhľadávacia aktivita sa používa na zlepšovanie skúseností s Vyhľadávaním, a zmeniť nastavenia toho, ktoré údaje sa ukladajú do vášho účtu Google.