A keresőalgoritmusok működése

Tekintettel az interneten rendelkezésre álló információ mennyiségére, a szükséges információ megtalálása a lehetetlennel volna határos, ha nem akadna segítség a kereséshez. A Google rangsorolási rendszerei pontosan erre szolgálnak: a Keresés indexében megtalálható több száz milliárd weboldal átválogatására, hogy megtalálják a leginkább releváns, hasznos eredményeket a másodperc töredéke alatt, és olyan módon adják elő őket, hogy az segítsen Önnek a keresett információ megtalálásában.

E rangsorolási rendszereket nem egyetlen algoritmus alkotja, hanem algoritmusok egész sora. Hogy a leghasznosabb információkkal láthassák el Önt, a Keresés algoritmusai számos tényezőt figyelembe vesznek, így például a lekérdezés szavait, az oldalak relevanciáját és hasznosságát, a források szakmaiságát, továbbá az Ön tartózkodási helyét és a beállításait. Az egyes tényezőknél alkalmazott súlyozás a lekérdezés jellegétől függően változik: például a tartalom frissessége nagyobb szerepet játszik az aktuális hírek témáira vonatkozó lekérdezéseknél, mint a szótári definíciókra vonatkozóknál.

Annak biztosítása érdekében, hogy a Keresés algoritmusai megfeleljenek a relevanciával és a minőséggel kapcsolatos szigorú követelményeknek, az élő teszteket és a világszerte tevékenykedő több ezer képzett keresésminőségi értékelőt egyaránt magukban foglaló szigorú folyamataink vannak. A minőségértékelők szigorú, a Keresés algoritmusaival kapcsolatos céljainkat meghatározó és bárki számára nyilvánosan megtekinthető irányelveket követnek.

Alább további információt talál azokról a fő tényezőkről, amelyek segítenek annak meghatározásában, hogy a rendszer mely eredményeket jelenítse meg a lekérdezésére:

  • A szavak elemzése

    A szavak elemzése

    Az, hogy megértsük a keresés értelmét, döntő fontosságú a hasznos válaszok megjelenítéséhez. A releváns információkat tartalmazó weboldalak felleléséhez vezető első lépés így hát az, hogy mit jelentenek a keresési lekérdezésben szereplő egyes szavak. Nyelvi modelleket építünk, amelyek megpróbálják megfejteni, milyen szavakat keressünk az indexünkben.

    Ez több mindent is magában foglal az elütések értelmezésének egyszerűnek tűnő lépésétől kezdve a beírt lekérdezés típusának felismeréséig, amelyhez a természetes nyelvfelismerés legújabb kutatási eredményeit használjuk fel. Szinonimarendszerünkkel például a Keresés akkor is megérti, hogy mit ért a kifejezés alatt, ha a szó több jelentéssel bír. Ennek a rendszernek a fejlesztése több mint öt éven át tartott, és a keresések több mint 30%-ában hozott jelentős fejlődést a használt nyelvtől függetlenül.

    Igyekszünk azt is megérteni, hogy Ön milyen kategóriájú információt keres. Vajon nagyon pontosan meghatározott keresésről van szó, vagy inkább tágabb értelmű a lekérdezés? Szerepelnek benne olyan kifejezések, mint az „értékelés”, „képek” vagy „nyitvatartási idő”, amelyek valamilyen konkrét információigényre utalnak? Olyan felkapott kulcsszavakra keres, amelyek azt sugallják, hogy az adott napon megjelent tartalmakra kíváncsi? Vagy esetleg valamilyen közeli vállalkozás a keresés tárgya, és helyi érdekű információkat szeretne megkapni?

  • A keresés megfeleltetése

    A keresés megfeleltetése

    A következő lépésben olyan weboldalakat keresünk, amelyek a lekérdezéshez kapcsolódó információkat tartalmaznak. Amikor Ön rákeres valamilyen kifejezésre, akkor algoritmusaink tulajdonképpen megkeresik az adott keresési kifejezéseket az indexben, hogy megtalálják a megfelelő weboldalakat. Kielemzik, hogy a kulcsszavak milyen gyakran és hol jelennek meg a weboldalon: a címben vagy fejlécekben, esetleg magában a szövegtestben.

    Az algoritmusok nem csak egyező kulcsszavakat keresnek, hanem olyan jeleket is, amelyekkel megmérhetik, mennyire hasznos válaszokat adhatnak a potenciális keresési találatok. Amikor a „kutyák” kifejezésre keres, feltehetőleg nem olyan weboldalra kíváncsi, ahol a „kutyák” kifejezés százszor is szerepel. Azt próbáljuk kitalálni, hogy a weboldal tartalmaz-e választ a lekérdezésre, és nem csak ismételgeti-e a keresett kifejezést. A keresőalgoritmusok tehát azt elemzik, hogy releváns tartalom szerepel-e az oldalakon – például kutyákat ábrázoló képek, videók, vagy akár listák a különböző kutyafajtákról. Végül pedig ellenőrizzük, hogy az oldal ugyanazon a nyelven íródott-e, mint a feltett kérdés, így az Ön által preferált nyelv szerint rangsoroljuk.

  • Hasznos oldalak rangsorolása

    Hasznos oldalak rangsorolása

    Egy átlagos lekérdezésre weboldalak ezrei, sőt, milliói tartalmazhatnak releváns választ. Így azért, hogy a legjobb oldalak kerüljenek legelőre, olyan algoritmusokat is írunk, amelyek kiértékelik a weboldalak hasznosságát.

    Ezek az algoritmusok száz és száz különböző tényezőt elemeznek, hogy megtalálják az internet által kínált információk közül a leghasznosabbakat. Ilyen tényező például a tartalom frissessége, az, hogy hányszor jelent meg a keresett kifejezés, illetve milyen minőségű felhasználói élményt biztosít az adott oldal. A témával kapcsolatos megbízhatóság és hozzáértés kiértékelése során olyan webhelyeket keresünk, amelyeket úgy tűnik, hogy hasznosnak találnak a felhasználók hasonló lekérdezéseknél. Ha a témában más jelentős webhely is hivatkozik az adott weboldalra, akkor azt a minőségi információ jelének vehetjük.

    Rengeteg spam jellegű webhely létezik, amelyek különböző ravasz technikák révén próbálnak a találati lista elejére kerülni: például kulcsszavakat ismételgetnek, vagy PageRank-mutatót befolyásoló linkeket vásárolnak meg. Ezek a webhelyek nagyon rossz felhasználói élményt nyújtanak, sőt, többük akár ártalmas is lehet, vagy félrevezetheti a Google felhasználóit. Emiatt olyan algoritmusokat írunk, amelyek beazonosítják és eltávolítják azokat a spam jellegű webhelyeket a találatok közül, amelyek megsértik a Google webmesteri irányelveit.

  • A legjobb találatok megjelenítése

    A legjobb találatok megjelenítése

    A találatok megjelenítése előtt mérlegeljük, hogyan illeszkedik egymáshoz az összes releváns információ: minden egy téma köré csoportosul a keresési találatok között, vagy több témáról is szó lehet? Nem szól túl sok weboldal ugyanarról az egyetlen szűk értelmezési lehetőségről? Arra törekszünk, hogy változatos információkat biztosítsunk olyan formátumokban, amelyek a keresés szempontjából a leghasznosabbak. Ahogyan az internet fejlődik, úgy fejlesztjük mi is rangsoroló rendszereinket, hogy még több lekérdezéshez jeleníthessünk meg még jobb találatokat.

  • A kontextus mérlegelése

    A kontextus mérlegelése

    Az olyan információk, mint az Ön tartózkodási helye, keresési előzményei és keresési beállításai mind-mind a segítségünkre vannak abban, hogy valóban az adott pillanatban hasznos és releváns találatokat jelenítsünk meg.

    Tartózkodási helyét és országát arra használjuk, hogy az adott területre vonatkozó tartalmakat jelenítsünk meg Önnek. Tegyük fel, hogy Ön Chicagóban van és a „futball” kifejezésre keres. Ebben az esetben a Google valószínűleg az amerikai futballhoz és a Chicago Bears csapathoz kapcsolódó találatokat mutatja előbb. Ugyanakkor ha London utcáin sétálva keresne ugyanerre, akkor a Google a labdarúgás és a Premier League találatait helyezi előrébb a találatok között. A Keresés beállításai szintén fontos mutatói annak, hogy milyen találatok számíthatnak hasznosnak: például a preferált nyelvi beállítás, illetve hogy engedélyezte-e a Biztonságos Keresést, amely kiszűri a szókimondó tartalmakat.

    Bizonyos esetekben előfordul, hogy személyre szabjuk a találatokat a legutóbbi keresési tevékenység adatai alapján. Például ha Ön a „Barcelona” szót írja be a keresőbe, de közben azt is tudjuk, hogy nemrég a „Barcelona vs Arsenal” kifejezésre keresett, akkor ez árulkodhat arról, hogy Önt a focicsapat érdekli, nem pedig a város. Megadhatja, hogy milyen keresési tevékenység használható a keresési élmény javításához (például beállíthatja azt is, hogy mely adatok kerüljenek mentésre Google-fiókjában) a myaccount.google.com oldalon.