Hoe resultaten automatisch worden gegenereerd
Gezien de grote hoeveelheid aan informatie op het web zou het vrijwel onmogelijk zijn om zonder hulp iets te zoeken. En dat is precies waar de rangschikkingssystemen van Google om de hoek komen kijken. In een fractie van een seconde doorzoeken ze honderden miljarden webpagina's en andere content in onze zoekindex om de meest relevante en bruikbare zoekresultaten te bieden.
Een zoekbalk met de zoekopdracht 'kapsalon bij mij in de buurt'
Belangrijke factoren in je zoekresultaten
Zoekalgoritmen kijken naar allerlei factoren om je de nuttigste informatie te tonen. Zo letten ze onder meer op hoe je de vraag formuleert, de relevantie en bruikbaarheid van pagina's, het expertiseniveau van bronnen en je locatie en instellingen. Hoe zwaar elke factor meeweegt, hangt af van de aard van je zoekopdracht. Meer recente informatie speelt bijvoorbeeld een grotere rol bij vragen over het laatste nieuws, terwijl dit bij vragen over definities in een woordenboek doorgaans niet relevant is.
Hieronder vind je meer informatie over de belangrijkste factoren die Zoeken gebruikt om te bepalen welke resultaten voor je zoekopdracht worden weergegeven:
De betekenis van je zoekopdracht

Voor relevante resultaten moeten we eerst vaststellen welke informatie je met je zoekopdracht zoekt: de intentie achter je zoekopdracht. Hiervoor hebben we taalmodellen ontwikkeld om te ontcijferen welke woordenreeksen we op basis van de paar zoekwoorden die je typt, moeten opzoeken in de index.

Dit bestaat uit eenvoudige stappen zoals het herkennen en corrigeren van spelfouten, maar gaat zo ver als het gebruik van ons geavanceerde synoniemensysteem. Hiermee kunnen we relevante documenten vinden, ook als deze niet exact de woorden bevatten als die je hebt getypt. Stel, je hebt gezocht naar 'helderheid laptop veranderen', terwijl de fabrikant de tekst 'helderheid laptop aanpassen' heeft gebruikt. Onze systemen begrijpen dat deze woorden en intenties aan elkaar gerelateerd zijn en verbinden je zo met de juiste content. We hebben meer dan 5 jaar gewerkt aan de ontwikkeling van dit systeem, dat de resultaten aanzienlijk verbetert in meer dan 30% van alle zoekopdrachten in verschillende talen.

Een zoekopdracht met 'hoe verander ik een gloeilamp' waarbij 'verander' wordt vervangen door 'vervang'

Onze systemen proberen ook te begrijpen wat voor soort informatie je zoekt. Als je woorden zoals 'koken' of 'foto's' in je zoekopdracht hebt gebruikt, weten onze systemen dat de weergave van recepten of afbeeldingen het beste overeenkomt met je intentie. Als je in het Frans zoekt, worden de meeste resultaten weergegeven in die taal, zoals je waarschijnlijk wilt. Ook lokale intenties worden door onze systemen herkend. Als je naar 'pizza' zoekt, krijg je dus resultaten van bedrijven in de buurt die bezorgen.

Als je naar trending zoekwoorden zoekt, begrijpen onze systemen dat actuele informatie waarschijnlijk nuttiger is dan oudere pagina's. Dit betekent dat als je zoekt naar sportuitslagen, bedrijfsresultaten of iets anders dat actueel is, je de meest recente informatie te zien krijgt.

Relevantie van content

Vervolgens analyseren onze systemen de content om te beoordelen of deze informatie bevat die relevant kan zijn voor wat je zoekt.

Het meest basale signaal dat informatie relevant is, is wanneer een webpagina dezelfde zoekwoorden bevat als je zoekopdracht. Als deze zoekwoorden op de pagina voorkomen of als ze voorkomen in de titel of hoofdtekst, is het waarschijnlijker dat de informatie relevant is.

Een website die met een vergrootglas wordt geïnspecteerd

Onze systemen kijken niet alleen naar zoekwoorden, maar analyseren ook of content op andere manieren relevant is voor een zoekopdracht. We maken gebruik van verzamelde, geanonimiseerde interactiegegevens om te beoordelen of zoekresultaten relevant zijn voor een zoekopdracht. We zetten die gegevens om in signalen die onze machine learning-systemen helpen de relevantie beter in te schatten. Wanneer je bijvoorbeeld naar 'honden' zoekt, wil je waarschijnlijk geen pagina zien waarop alleen honderden keren het woord 'honden' staat. Met dat in het achterhoofd beoordelen algoritmen of een pagina andere relevante content bevat naast het zoekwoord 'honden', zoals foto's van honden, video's of zelfs een lijst van hondenrassen.

Hoewel onze systemen zoeken naar dit soort kwantificeerbare signalen om de relevantie te beoordelen, is het belangrijk om op te merken dat ze niet zijn ontworpen om subjectieve concepten te analyseren, zoals een standpunt of politieke gedachtegang van de content van een pagina.

De kwaliteit van content

Nadat de relevante content is gevonden, proberen onze systemen prioriteit te geven aan de content die het nuttigst lijkt. Onze systemen herkennen signalen die kunnen bepalen welke content deskundige, gezaghebbende en betrouwbare informatie over een bepaald onderwerp geeft.

Een van de factoren waarmee we dit bepalen, is door te kijken of andere prominente websites naar de content linken of ernaar verwijzen. Dit blijkt een goed teken van betrouwbare informatie te zijn. We gebruiken de verzamelde feedback uit ons evaluatieproces voor de kwaliteit van Zoeken om verder te verfijnen hoe onze systemen de kwaliteit van informatie beoordelen.

Een website die wordt geanalyseerd door een algoritme

Zowel de content op internet als het steeds groter wordende ecosysteem van informatie blijven voortdurend veranderen. We meten en beoordelen daarom constant de kwaliteit van onze systemen, zodat we zeker weten dat we de juiste balans vinden tussen de relevantie en de gezaghebbendheid van informatie. Zo kun je blijven vertrouwen of de resultaten die je ziet.
Bruikbaarheid van webpagina's

Onze systemen beoordelen ook de bruikbaarheid van content. Als de content relatief gelijkwaardig is, kan de content die beter toegankelijker is, beter presteren.

Onze systemen kijken bijvoorbeeld naar aspecten op het gebied van de pagina-ervaring, bijvoorbeeld of content mobielvriendelijk is, zodat mensen op mobiele apparaten de content makkelijk kunnen bekijken. Ook checken onze systemen of content snel wordt geladen, wat ook belangrijk is voor mobiele gebruikers.

Een website met een gouden badge

Context en instellingen

Op basis van informatie zoals je locatie, eerdere zoekgeschiedenis en zoekinstellingen kunnen we je resultaten aanpassen aan wat op dat moment het meest nuttig en relevant voor jou is.

We gebruiken informatie over je land en locatie om content te bieden die relevant is voor je regio. Als je bijvoorbeeld in Chicago bent en naar 'football' zoekt, laat Google je waarschijnlijk eerst resultaten voor American football en de Chicago Bears zien. Als je in Londen naar 'football' zoekt, plaatst Google de resultaten over voetbal en de eredivisie op een hogere positie. Je zoekinstellingen zijn ook een belangrijke indicator voor de resultaten die je waarschijnlijk nuttig vindt. Zo kun je een voorkeurstaal instellen of je aanmelden voor SafeSearch (een tool waarmee expliciete resultaten worden weggefilterd).

2 websites met een voetbal en een American football

Google Zoeken omvat ook functies die resultaten personaliseren op basis van activiteit in je Google-account. Als je bijvoorbeeld zoekt naar 'evenementen bij mij in de buurt', kan Google enkele aanbevelingen voor evenementcategorieën op jou afstemmen omdat we denken dat je daarin geïnteresseerd bent.

Deze systemen zijn zo ontworpen dat ze zoeken naar overeenkomsten met je interesses, maar ze zijn niet ontworpen om hieruit gevoelige kenmerken (zoals je ras, religie of politieke partij) af te leiden.

Je kunt via myaccount.google.com bepalen welke zoekactiviteit wordt gebruikt om de functies van Google Zoeken voor jou te verbeteren. Zo kun je ook aangeven welke gegevens worden opgeslagen in je Google-account. Als je personalisatie van Google Zoeken op basis van activiteit in je account wilt uitschakelen, moet je Web- en app-activiteit uitschakelen.

In de instellingen vind je ook contentvoorkeuren, bijvoorbeeld voor SafeSearch. Via deze voorkeuren kun je aangeven of in zoekresultaten gewelddadige beelden mogen worden weergegeven die mogelijk schokkend kunnen zijn voor bepaalde gebruikers.