כיצד פועלים האלגוריתמים של החיפוש

בגלל כמויות המידע שזמין באינטרנט, זה כמעט בלתי אפשרי למצוא את מה שאתם צריכים ללא עזרה במיון המידע. מערכות הדירוג של Google מיועדות למטרה זו בדיוק: הן ממיינות מאות מיליארדי דפי אינטרנט באינדקס החיפוש שלנו כדי למצוא את התוצאות הרלוונטיות והשימושיות ביותר בשבריר שנייה, ומציגות אותן באופן שיעזור לכם למצוא את מה שאתם מחפשים.

מערכות הדירוג האלו מורכבות מסדרה שלמה של אלגוריתמים. כדי להעניק לכם את המידע השימושי ביותר, האלגוריתמים של החיפוש בוחנים גורמים רבים, כולל המילים שבשאילתה, נוחות השימוש ורמת הרלוונטיות של הדפים, רמת המומחיות של המקורות וגם המיקום וההגדרות שלכם. המשקל שניתן לכל גורם משתנה בהתאם לסוג השאילתה. לדוגמה, מידת העדכניות של התוכן חשובה במענה על שאילתות לגבי נושאים עכשוויים בחדשות, יותר משהיא חשובה בקשר להגדרות מילוניות.

כדי להבטיח שהאלגוריתמים של החיפוש עומדים בסטנדרטים גבוהים של רלוונטיות ואיכות, אנחנו משתמשים בתהליך קפדני שכולל בדיקות פעילות וגם אלפי מדרגים חיצוניים של איכות החיפוש מרחבי העולם. מדרגי האיכות האלו פועלים לפי הנחיות קפדניות שמגדירות את היעדים שלנו לאלגוריתמים של החיפוש, והן גלויות לכול.

ניתן למצוא מידע נוסף בהמשך על הגורמים העיקריים שעוזרים לקבוע אילו תוצאות יוחזרו עבור השאילתה שלכם:

  • ניתוח המילים שלכם

    ניתוח המילים שלכם

    כדי שנוכל להציג תשובות מועילות, חשוב מאוד שנבין את משמעות החיפוש שלכם. לכן, כדי למצוא דפים עם מידע רלוונטי, השלב הראשון הוא לנתח את משמעות המילים בשאילתת החיפוש. אנחנו בונים מודלים של שפה כדי לנסות לפענח אילו רצפי מילים או מילים בודדות אנחנו צריכים לחפש באינדקס.

    זה כולל פעולות שהן כביכול פשוטות, כמו פענוח שגיאות איות, אך גם אתגרים מורכבים כמו ניסיון להבין את סוג השאילתה שהזנתם בעזרת יישום של תובנות ממחקרים עדכניים לגבי הבנת שפה טבעית. לדוגמה, מערכת המילים הנרדפות שלנו עוזרת לשירות החיפוש להבין למה אתם מתכוונים, גם אם למילה מסוימת יש הגדרות רבות. פיתוח המערכת הזו ארך יותר מחמש שנים, והיא משפרת באופן משמעותי את התוצאות ביותר מ-30% מהחיפושים בשפות שונות.

    אנחנו גם מנסים להבין מהי קטגוריית המידע שאתם מחפשים. האם זה חיפוש ספציפי מאוד או שאילתה כללית? האם החיפוש כולל מילים כמו "ביקורת", "תמונה" או "שעות פתיחה" שמציינות צורך במידע ספציפי? האם אתם מחפשים מילות מפתח פופולריות שמרמזות על כך שאתם מעוניינים בתוכן שפורסם באותו יום? או אולי אתם מחפשים עסק קרוב ורוצים מידע מקומי?

  • מציאת התאמות לחיפוש

    מציאת התאמות לחיפוש

    בשלב הבא, אנחנו מחפשים דפי אינטרנט עם מידע שתואם לשאילתה. כשאתם מחפשים, הפעולה הבסיסית ביותר שהאלגוריתמים מבצעים היא לחפש באינדקס את מונחי החיפוש כדי למצוא את הדפים המתאימים. הם מנתחים את התדירות והמיקום שבהם מילות המפתח האלה מופיעות בדף, בין אם מדובר בכותרות או בגוף הטקסט.

    בנוסף להתאמת מילות מפתח, האלגוריתמים בוחנים גם רמזים כדי להעריך מהי מידת התועלת של תוצאות חיפוש פוטנציאליות למשתמשים. כשאתם מחפשים את המילה "כלבים", מן הסתם אתם לא מעוניינים בדף שבו המילה "כלבים" מופיעה מאות פעמים. אנחנו מנסים להבין אם הדף מכיל תשובה לשאילתה שלכם, ולא רק חוזר על המילים שמופיעות בה. האלגוריתמים של החיפוש בודקים אם הדפים כוללים תוכן רלוונטי – כמו תמונות או סרטונים של כלבים, או אפילו רשימת גזעים. לסיום, אנחנו בודקים אם הדף כתוב בשפה שבה השאלה נכתבה כדי לתת עדיפות לדפים בשפה המועדפת עליכם.

  • דירוג דפים מועילים

    דירוג דפים מועילים

    שאילתה טיפוסית יכולה להניב אלפים ואפילו מיליונים של דפי אינטרנט עם מידע שעשוי להיות רלוונטי. כדי שהדפים הטובים ביותר יופיעו במיקום הגבוה ביותר, אנחנו גם מפתחים אלגוריתמים שמעריכים את התועלת של דפי האינטרנט האלה.

    האלגוריתמים האלה מנתחים מאות גורמים שונים כדי לנסות להציג את המידע האיכותי ביותר באינטרנט. בין היתר, הגורמים יכולים להיות עדכניות התוכן, מספר הפעמים שמונחי החיפוש מופיעים בתוכן וחוויית המשתמש בדף. כדי להעריך את האמינות והמהימנות ביחס לנושא הנדון, אנחנו מחפשים אתרים שנראה כי משתמשים רבים העדיפו בשאילתות דומות. אם אתרים בולטים אחרים בנושא מקשרים אל הדף, זה סימן טוב לכך שהמידע איכותי.

    יש באינטרנט הרבה אתרי ספאם שמנסים להגיע באופן מניפולטיבי אל ראש תוצאות החיפוש בעזרת טכניקות כמו חזרה על מילות מפתח או קניית קישורים שעוקפים את דירוג הדף. האתרים האלה מספקים חוויית משתמש באיכות ירודה ואפילו עשויים לגרום נזק למשתמשי Google או להטעות אותם. לכן אנחנו מפתחים אלגוריתמים לזיהוי ספאם והסרה של אתרים שמפרים את ההנחיות של Google למנהלי אתרים מהתוצאות שלנו.

  • הצגת התוצאות הטובות ביותר

    הצגת התוצאות הטובות ביותר

    לפני שאנחנו מציגים לכם את התוצאות, אנחנו בודקים את ההתאמה בין כל חלקי המידע הרלוונטי: האם יש רק נושא אחד בתוצאות החיפוש, או כמה נושאים? האם יש יותר מדי דפים שמתמקדים בפרשנות צרה אחת? אנחנו משתדלים לספק מידע מגוון בפורמטים המועילים ביותר לסוג השאילתה שלכם. ככל שהאינטרנט מתפתח, אנחנו מפתחים את מערכות הדירוג כדי לספק תוצאות טובות יותר בתגובה למספר גדול יותר של שאילתות.

  • להקשר יש משמעות

    להקשר יש משמעות

    בעזרת מידע כמו המיקום שלכם, היסטוריית חיפושים והגדרות החיפוש, אנחנו מתאימים עבורכם את התוצאות המועילות והרלוונטיות ביותר לכם באותו רגע.

    אנחנו משתמשים במידע על המדינה והמיקום שלכם כדי לספק תוכן רלוונטי לאזור. לדוגמה, אם אתם בשיקגו ומחפשים את המונח "football‏", Google כנראה תציג תוצאות לגבי פוטבול (ולא כדורגל), וקבוצת השיקגו ברס תופיע ראשונה. לעומת זאת, אם תחפשו את המילה "football" בלונדון, Google תיתן עדיפות לתוצאות לגבי כדורגל והפרמייר ליג. הגדרות חיפוש הן עוד סימן חשוב לגבי התוצאות שכנראה יהיו מועילות עבורכם. לדוגמה, אם הגדרתם שפה מועדפת או הבעתם הסכמה לחיפוש בטוח (כלי שעוזר לסנן תוצאות בוטות).

    במקרים מסוימים אנחנו עשויים גם להתאים אישית את התוצאות בעזרת מידע לגבי פעילות החיפוש שלכם בתקופה האחרונה. לדוגמה, אם תחפשו "ברצלונה" ולאחרונה חיפשתם "ברצלונה מול ארסנל", זה יכול להיות רמז חשוב שאתם מעוניינים במידע על קבוצת הכדורגל ולא על העיר. אפשר לקבוע איזו פעילות חיפוש תשמש לשיפור החוויה בחיפוש, וגם לשנות את סוג הנתונים שנשמרים בחשבון Google. אפשר לקבוע את ההגדרות האלה בכתובת myaccount.google.com.