Miten Haku järjestää tietoa

Ennen hakujen tekemistä indeksointirobotit keräävät tietoa sadoilta miljardeilta verkkosivuilta ja järjestävät sitä Haun hakemistoon.

Haun perusteet

Indeksointiprosessi alkaa verkko-osoitteista, jotka on indeksoitu aiemmin, ja sivustokartoista, jotka on saatu verkkosivuston omistajilta. Kun robotti käy näillä sivustoilla, se käyttää niillä olevia linkkejä muiden sivujen löytämiseen. Ohjelmisto kiinnittää huomiota erityisesti uusiin sivustoihin, sivustoille tehtyihin muutoksiin ja linkkeihin, jotka eivät toimi. Ohjelmat päättävät, mitä sivustoja indeksoidaan, miten usein tämä tapahtuu ja montako sivua kultakin sivustolta haetaan.

Verkkovastaavien työkalujemme avulla sivuston omistaja voi valita tarkasti, miten Google indeksoi hänen sivustonsa. Verkkovastaava voi pyytää uudelleenindeksointia tai lopettaa indeksoinnin kokonaan “robots.txt”-tiedostoa käyttämällä. Google ei nosta indeksointitiheyttä maksusta – kaikilla sivustoilla on käytössään samat työkalut, jotta käyttäjät saavat parhaita mahdollisia tuloksia.

Tietojen etsiminen indeksoimalla

Verkko on kuin koko ajan kasvava kirjasto, jossa on miljardeja kirjoja mutta ei lajittelujärjestelmää. Me käytämme indeksointirobotteja yleisessä käytössä olevien verkkosivujen löytämiseen. Robotit tutkivat verkkosivuja ja seuraavat sivujen linkkejä samalla periaatteella kuin käyttäjät, jotka selaavat verkkosisältöä. Ne siirtyvät linkistä toiseen ja palauttavat tiedot Googlen palvelimille.

Tietojen järjestäminen indeksoimalla

Kun indeksointirobotti löytää verkkosivun, järjestelmämme piirtää sivun sisällön samalla tavoin kuin selain. Huomioimme tärkeitä seikkoja, esimerkiksi avainsanat ja sivun tuoreuden, ja lisäämme kaikki sivun tiedot Haun hakemistoon.

Google Haun hakemistossa on satoja miljardeja verkkosivuja ja kooltaan se on yli sata miljoonaa gigabittiä. Se vastaa kirjan hakemistoa, jossa luetellaan hakemiston kaikkien verkkosivujen kaikki sanat. Kun indeksoimme verkkosivun, se lisätään kaikkien sivulla olevien sanojen kohtiin.

 

 

Tietograafi on yksi tapa kehittää hakua pelkistä avainsanaosumista käyttäjälle tärkeiden henkilöiden, paikkojen ja asioiden parempaan ymmärtämiseen. Tätä tarkoitusta varten järjestämme verkkosivujen tietojen lisäksi myös muunlaisia tietoja. Google Haussa voit jo nyt hakea tekstiä miljoonista suurten kirjastojen kirjoista, matka-aikoja alueesi joukkoliikenneorganisaatiolta tai tietoa julkisilta tahoilta, esimerkiksi Maailmanpankilta.