Com funcionen els algoritmes de la Cerca

Com que vols una resposta, i no pas milers de milions de pàgines web, els sistemes de classificació de Google ordenen els centenars de milers de milions de pàgines web del nostre índex de cerca per oferir-te resultats útils i rellevants en una fracció de segon.

Aquests sistemes de classificació estan formats per una sèrie d'algoritmes que analitzen què cerques i quina informació se t'hauria de mostrar. La Cerca ha evolucionat en gran mesura des dels seus inicis, i hem anat refinant els nostres algoritmes per tal d'avaluar les cerques i els resultats amb més detalls i fer que els nostres serveis et funcionin millor.

Aquestes són algunes de les maneres com Google fa servir algoritmes de cerca per oferir informació útil del web:

  • Analitzar les teves paraules

    Analitzar les teves paraules

    Comprendre el significat de la cerca és crucial per oferir respostes satisfactòries. Per tant, per trobar pàgines amb informació rellevant, el primer que fem és analitzar què volen dir les paraules de la teva consulta de cerca. Creem models de llenguatge per intentar desxifrar quines cadenes de paraules hem de buscar a l'índex.

    Aquest procés inclou passos aparentment senzills, com ara interpretar errades ortogràfiques, i també passos més complexos, com ara comprendre el tipus de consulta que has introduït aplicant els últims avenços en el camp de la comprensió del llenguatge natural. Per exemple, el nostre sistema de sinònims ajuda la Cerca a interpretar què vols dir encara que una paraula tingui diverses definicions. Aquest sistema, que s'ha tardat més de cinc anys a desenvolupar, millora significativament els resultats en més del 30% de les cerques en tots els idiomes.

    També intentem comprendre quin tipus d'informació busques. És una cerca molt específica o més aviat general? Inclou paraules com "opinions", "imatges" o "horari" que indiquen que s'està cercant una cosa concreta? Cerques paraules clau populars que suggereixen que vols contingut que s'ha publicat aquell dia? O cerques una empresa a prop i vols informació local?

  • Cercar coincidències de la cerca

    Cercar coincidències de la cerca

    Després, cerquem pàgines web amb informació que coincideixi amb la consulta. Quan fas una cerca, al nivell més bàsic, els nostres algoritmes cerquen els teus termes de cerca a l'índex per trobar les pàgines adequades. Analitzen la freqüència i el lloc on es mostren les paraules clau en una pàgina, ja sigui en títols, encapçalaments o el cos del text.

    A més de cercar coincidències amb les paraules clau, els algoritmes també cerquen pistes que indiquin si els resultats potencials de la cerca tenen la informació que cerca l'usuari. Quan cerques "gossos", probablement no vols veure una pàgina on aparegui centenars de vegades la paraula "gossos". Intentem esbrinar si la pàgina conté una resposta a la teva consulta i no només la repeteix. Per tant, els algoritmes analitzen si les pàgines inclouen contingut rellevant, com ara, en aquest cas, imatges o vídeos de gossos, o fins i tot una llista de races. Finalment, comprovem que la pàgina estigui escrita en el mateix idioma que la teva pregunta, per prioritzar les pàgines que estan escrites en l'idioma que prefereixes.

  • Millorar el posicionament de les pàgines útils

    Millorar el posicionament de les pàgines útils

    Per a una consulta normal, hi ha milers, fins i tot milions, de pàgines web amb informació potencialment rellevant. Per això, per ajudar-nos a classificar les millors pàgines en les primeres posicions, també escrivim algoritmes que avaluen la utilitat d'aquestes pàgines web.

    Per mostrar la millor informació que pot oferir el web, aquests algoritmes analitzen centenars de factors diferents, des de la data de publicació del contingut fins al nombre de vegades que apareixen els teus termes de cerca i la qualitat de l'experiència d'usuari a la pàgina. A més, cerquem llocs web que hagin estat útils en consultes similars per avaluar-ne la fiabilitat i la credibilitat. Si altres llocs web destacats sobre el tema contenen enllaços a aquesta pàgina, és un bon senyal que la informació és d'alta qualitat.

    Al web hi ha molts llocs web amb contingut fraudulent que tracten de situar-se entre els primers llocs dels resultats de la cerca mitjançant tècniques, com ara repetir paraules clau constantment o comprar enllaços que millorin la classificació de PageRank. Aquests llocs web ofereixen una experiència d'usuari molt dolenta i poden fins i tot ser perjudicials o enganyosos per als usuaris de Google. Per això, escrivim algoritmes per identificar i suprimir dels resultats que oferim els llocs web que infringeixen les directrius per a administradors web de Google.

  • Tornar els millors resultats

    Tornar els millors resultats

    Abans de mostrar-te els resultats de la cerca, analitzem tota la informació en conjunt, és a dir, si hi ha només un tema en els resultats de la cerca, o si hi ha massa pàgines que se centrin en una única interpretació. Procurem proporcionar informació diversa en els formats més útils per al tipus de cerca que has fet. I a mesura que evoluciona el web anem desenvolupant els nostres sistemes de classificació per proporcionar millors resultats per a un major nombre de consultes.

  • Tenir en compte el context

    Tenir en compte el context

    Informació com ara la teva ubicació, l'historial de cerques anteriors i la configuració de la Cerca ens ajuda a adaptar els resultats i oferir-te allò que et serà més útil i rellevant en aquell moment.

    Fem servir el teu país i la teva ubicació per oferir-te contingut rellevant per a la regió on et trobis. Per exemple, si vius a Barcelona i cerques "futbol", Google probablement et mostrarà resultats sobre la Lliga espanyola i el F. C. Barcelona en primer lloc. En canvi, si cerques "futbol" a Chicago, Google classificarà en posicions més elevades els resultats sobre futbol americà i els Chicago Bears. La configuració de la Cerca és també un indicador important dels resultats que probablement et semblin més útils, per exemple si has establert un idioma preferit o has activat SafeSearch (una eina que ajuda a filtrar els resultats amb contingut explícit).

    En alguns casos també podem personalitzar els resultats fent servir informació sobre l'activitat recent de l'usuari a la Cerca. Per exemple, si cerques "Barcelona" i fa poc has cercat "Barcelona - Arsenal", aquesta podria ser una pista important de la informació que t'interessa, en aquest cas sobre el club de futbol i no pas la ciutat. Pots controlar quina activitat de cerca es fa servir per millorar l'experiència amb la Cerca, com ara ajustar quines dades es desen al teu compte de Google, a myaccount.google.com.