Miten Haun algoritmit toimivat

Käyttäjä haluaa löytää vastauksen, ei miljardeja verkkosivuja, joten Googlen sijoitusjärjestelmä lajittelee satoja miljardeja Haun hakemistossa olevia verkkosivuja näyttääkseen hyödyllisiä ja osuvia tuloksia sekunnin murto-osassa.

Sijoittumisjärjestelmä muodostuu algoritmien sarjasta, joka analysoi, mitä yrität hakea ja mitä sinulle pitäisi näyttää. Samalla kun olemme kehittäneet hakujärjestelmäämme käyttökelpoisemmaksi, olemme muokanneet algoritmeja niin, että ne arvioivat hakutuloksia aiempaa yksityiskohtaisemmin: näin palvelumme toimii sinulle entistä paremmin.

Tässä on muutamia esimerkkejä siitä, miten Google käyttää hakualgoritmeja hyödyllisten hakutulosten antamiseen:

  • Sanojen analysointi

    Sanojen analysointi

    Meille on tärkeää ymmärtää hakusi tarkoitus voidaksemme tarjota sinulle hyviä vastauksia. Löytääksemme sivuja, joissa on hakusi kannalta olennaista tietoa, analysoimme mitä hakukyselyssäsi olevat sanat tarkoittavat. Rakennamme kielellisiä malleja selvittääksemme, mitä sanoja meidän pitäisi löytää hakemistosta.

    Tämä sisältää näennäisen yksinkertaisia toimia, esimerkiksi kirjoitusvirheiden tunnistamista. Toisaalta sovellamme viimeisimpiä kielen tulkitsemisen tutkimustuloksia ymmärtääksemme kyselyitä. Esimerkiksi synonyymien käsittely auttaa hakujärjestelmää ymmärtämään tarkoituksesi, jos sanalle on useita määritelmiä. Järjestelmän kehittäminen kesti yli viisi vuotta, ja se parantaa eri kielillä tehtyjen hakujen tuloksia yli 30 %:ssa tapauksista.

    Yritämme tulkita, minkätyyppistä tietoa etsit. Onko hakusi tarkkaan rajattu vai laaja? Onko siinä sanoja, jotka kuvaavat haun kohteena olevaa tietotyyppiä, esimerkiksi "arvostelu", "kuvat" tai "aukioloajat"? Etsitkö sillä hetkellä suosittuja avainsanoja, jolloin haluat ehkä julkaista sisältöä saman tien, vai lähellä olevaa yritystä, jolloin haluat paikallisia tietoja?

  • Vastaavuuksien löytäminen

    Vastaavuuksien löytäminen

    Seuraavaksi etsimme verkkosivuja, joiden sisältö vastaa kyselyäsi. Kun teet haun, algoritmimme aloittavat sen käsittelyn vertaamalla hakutermejä niitä mahdollisesti vastaaviin hakemiston sivuihin. Ne analysoivat avainsanojen esiintymistiheyttä ja ‑paikkoja ‎sivulla ja sitä, ovatko ne sivun otsikoissa vai leipätekstissä.

    Avainsanojen vastaavuuksien lisäksi algoritmit etsivät merkkejä siitä, miten hyvin mahdolliset hakutulokset vastaavat käyttäjän tarpeisiin. Jos haet esimerkiksi koiria, et välttämättä halua sivua, jolla toistetaan satoja kertoja sanaa koirat. Yritämme selvittää, vastaako sivu kyselyysi vai toistaako se vain kyselyn. Tätä varten algoritmimme selvittävät, onko sivulla asianmukaista sisältöä, kuten koirien kuvia, videoita tai luettelo roduista. Lopuksi katsomme, onko sivu kirjoitettu kyselysi kielellä, jotta kielelläsi kirjoitetut tulokset voidaan nostaa etusijalle tuloksissa.

  • Sivujen asettaminen hyödyllisyysjärjestykseen

    Sivujen asettaminen hyödyllisyysjärjestykseen

    Yhtä hakua kohti saattaa löytyä tuhansia, jopa miljoonia verkkosivuja, joilla voi olla hakijalle olennaista tietoa. Jotta parhaat sivut voidaan näyttää listan kärjessä, algoritmimme arvioivat verkkosivujen hyödyllisyyttä.

    Algoritmit ottavat huomioon satoja tekijöitä arvioidessaan, mikä on parasta mahdollista näytettävää tietoa. Tekijöitä ovat esimerkiksi sisällön tuoreus, hakutermien esiintymien määrä ja sivun käyttökokemuksen laatu. Arvioimme sivun luotettavuutta ja aihetuntemusta tutkimalla sivustoja, joihin monet käyttäjät luottavat samanlaisten kyselyjen yhteydessä. Jos muut tärkeät sivustot linkittävät sivulle, sen sisältö on todennäköisemmin laadukasta.

    Verkossa on monia roskasivustoja, jotka pyrkivät hakutulosten kärkeen esimerkiksi avainsanojen jatkuvalla toistamisella tai PageRankia siirtäviä linkkejä ostamalla. Näiden sivustojen käyttökokemus voi olla heikko ja ne voivat jopa vahingoittaa Googlen käyttäjiä tai johtaa heitä harhaan. Siksi kehitimme algoritmeja, jotka tunnistavat roskasisällön ja poistavat tuloksista Googlen verkkovastaavan ohjeiden vastaiset tulokset.

  • Parhaiden tulosten näyttäminen

    Parhaiden tulosten näyttäminen

    Ennen hakutulosten näyttämistä arvioimme, miten kaikki olennainen tieto sopii yhteen: onko hakutulosten joukossa vain yksi aihe vai useita? Onko liian moni sivuista keskittynyt yhteen, kapeaan näkökulmaan? Pyrimme antamaan monipuolisen valikoiman tietoa niissä muodoissa, jotka ovat kyselysi kannalta hyödyllisimpiä. Verkkosisällön muuttuessa jatkuvasti kehitämme myös hakusijoitusjärjestelmiämme voidaksemme tarjota parempia vastauksia yhä useampiin kysymyksiin.

  • Kontekstin huomioiminen

    Kontekstin huomioiminen

    Sinulle valitaan hakuhetkellä hyödyllisimpiä ja osuvimpia tuloksia esimerkiksi sijainnin, hakuhistorian ja hakuasetuksien perusteella.

    Näytämme sinulle alueesi kannalta osuvaa tietoa maa- ja sijaintitietojen avulla. Jos esimerkiksi haet jalkapalloa ja olet Chicagossa, Google näyttää todennäköisesti sinulle aluksi tuloksia amerikkalaisesta jalkapallosta ja Chicago Bears ‑joukkueesta. Jos taas haet jalkapalloa Lontoossa, Google sijoittaa jalkapallo- ja Valioliiga-tuloksia korkeammalle. Hakuasetuksistasi voidaan myös päätellä, mitä tuloksia pidät hyödyllisinä: siellä voit valita kielen tai ottaa käyttöön SafeSearch-työkalun, joka auttaa suodattamaan pois avoimen seksuaalisia tuloksia.

    Joskus käytämme tietoja aiemmista hauistasi myös tulosten personointiin. Jos esimerkiksi haet sanaa Barcelona ja olet äskettäin tehnyt haun Barcelona vastaan Arsenal, päättelemme, että sinua kiinnostaa jalkapallojoukkue kaupungin sijaan. Osoitteessa myaccount.google.com voit hallita hakukokemuksen optimointiin käytettäviä tietoja ja Google-tilillesi tallennettavia tietoja.