Az információk rendszerezése

Még mielőtt Ön beírná a keresését, a webes robotok több száz milliárd weboldalról gyűjtenek információt, majd rendszerezik őket a keresési indexben.

A keresés alapjai

A feltérképezési folyamat a korábbi feltérképezésekből és a webhelytulajdonosok által megadott oldaltérképekből származó weboldalak listájával kezdődik. A robotok meglátogatják ezeket az oldalakat, majd az ott fellelhető linkek segítségével további oldalakat fedeznek fel. A szoftver különös figyelmet szentel az új webhelyeknek, a meglévő webhelyek módosításainak és az inaktív linkeknek. Számítógépes programok határozzák meg, hogy mely webhelyeket és milyen gyakran kell feltérképezni, és hogy hány weboldalt kell lekérni minden egyes webhelyről.

A webhelyek tulajdonosainak különböző webmestereszközöket kínálunk. Ezek az eszközök részletekbe menő választási lehetőséget biztosítanak nekik arról, hogyan térképezheti fel webhelyüket a Google: aprólékos útmutatást adhatnak oldalaik feldolgozási módjáról, kérhetik az oldaluk újbóli feltérképezését, vagy egy „robots.txt” nevű fájl segítségével teljes egészében elutasíthatják a feltérképezést. A Google soha nem fogad el fizetséget azért, hogy bármelyik oldalt gyakrabban térképezze fel – ugyanazokat az eszközöket használjuk az összes webhely esetében, így biztosítva a lehető legpontosabb találatokat felhasználóink számára.

Információkeresés feltérképezéssel

Az internet olyan, mint egy folyamatosan bővülő könyvtár, ahol könyvek milliárdjait őrzik, de nincs központi katalógusrendszer. Webes robotoknak nevezett szoftvereket használunk arra, hogy felfedezzük a nyilvánosan rendelkezésre álló weboldalakat. Ezek a feltérképező robotok átnézik a weboldalakat, és követik a rajtuk található linkeket – hasonlóan ahhoz, ahogyan akár Ön is tenné böngészés közben. Linkről linkre haladnak, majd visszahozzák a weboldalakon talált adatokat a Google szervereire.

Információk rendezése indexeléssel

Amikor a robotok rátalálnak egy weboldalra, a rendszereink megjelenítik az oldal tartalmát – ugyanúgy, mint a böngészők. Megfigyeljük az olyan kulcsfontosságú jeleket, mint a kulcsszavak vagy a weboldal frissessége, és eltesszük őket a keresési indexben.

A Google Keresés indexe weboldalak százmilliárdjait tartalmazza, mérete pedig jóval meghaladja a 100 000 000 gigabájtot. Olyan ez, mint egy könyv tárgymutatója – külön bejegyzéssel minden indexelt weboldal minden egyes szavához. Az indexelés során – az oldalakon szereplő összes szót figyelembe véve – hozzáadjuk a weboldalakat a bejegyzésekhez.

 

 

A Tudásgráffal az a célunk, hogy túlmutatva a puszta kulcsszóegyezésen jobban megértsük, milyen emberek, helyek és dolgok érdeklik Önt. Ennek érdekében nem csupán a weboldalak információit rendszerezzük. Mára a Google Kereséssel a fontosabb könyvtárakban fellelhető könyvek millióiban kereshet, utánanézhet a menetidőknek a helyi közlekedési vállalatnál, vagy olyan nyilvános adatforrásokban böngészhet, mint a Világbank adatbázisa.