一般的な検索キーワードの場合、有用な情報を含むウェブページの数は、数千ないし数百万に及びます。アルゴリズムとは、質問を受け取って結果を返すコンピュータのプロセスと数式です。今日の Google のアルゴリズムは、本当に探している情報を推測することを実現する 200 を超える独自のシグナル、つまり「手がかり」を利用しています。これらのシグナルには、ウェブサイト上の語句、コンテンツの新しさ、お住まいの地域、PageRank などが含まれます。

検索プロジェクト

検索プロセスと検索結果ページにはさまざまな要素があります。Google では、より適切な検索結果を提供できるよう、技術とシステムを常に更新しています。これらの変更には、ナレッジ グラフや Google インスタント検索など、刺激的で革新的な新サービスも含まれています。常に調整を加え改良している重要なシステムは他にもあります。次のプロジェクトの一覧から、検索のさまざまな側面を垣間見ることができます。

スピード アンサー

天気、スポーツのスコア、調べ物など、知りたい情報をすばやく表示する。

オートコンプリート

ユーザーが検索する可能性のあるものを予測する。これには、複数の意味を持つ言葉を理解することも含まれます。

書籍

世界中の図書館や出版社の何百万もの書籍(プレビューや本文など)から結果を検索する。

コンテンツの新しさ

最新のニュースや情報を表示する。これには、ユーザーが特定の日付を検索したときに、その日付に関連する検索結果を収集することも含まれます。

Google インスタント検索

入力と同時に検索結果を表示する。

画像

検索結果と一緒にサムネイルを表示して、アクセスするページをイメージで判断できるようする。

インデックスへの登録

システムを使用して、ウェブ上のドキュメントを収集して保存する。

ナレッジ グラフ

現実世界の人物、場所、物、それらの関係性をデータベース化し、それに基づいて検索結果を表示する。

Google モバイル

タブレットやスマートフォンのようなモバイルデバイス専用に設計された機能に対応する。

ニュース

世界中のオンライン新聞やブログからの検索結果を含める。

クエリの解析

入力された語句の深い意味を理解する。

絞り込み

「検索オプション」、他のキーワードなど、検索ツールを使って検索を微調整できる機能を提供する。

セーフサーチ

検索結果に表示される成人向けのウェブページ、画像、動画の数を制限する。

検索方法

「画像検索」や「音声検索」のような新しい検索方法を開発する。

サイトとページの品質

情報源がどのくらい信用できるか、評判が良いか、権威があるかなどを、何らかのシグナルで判断できるようにする(このようなシグナルの 1 つが PageRank です。PageRank は Google の当初からのアルゴリズムの 1 つで、ページ間のリンクを見てその関連性を識別するものです)。

スニペット

検索結果ごとに、簡単なプレビュー情報(ページのタイトルや説明文など)を表示する。

スペル

スペルミスを特定し、修正したり別の候補を表示したりする。

同義語

同じような意味を持つ単語を認識する。

翻訳と多言語対応

言語や国に基づいて検索結果をカスタマイズする。

ユニバーサル検索

画像、ニュース、地図、動画、個人のコンテンツなど、関連性の高いコンテンツを 1 つの検索結果ページに統合する。

ユーザーのコンテキスト

地域ウェブ履歴などの要素に基づいて、より関連性の高い検索結果を提供する。

動画

動画の検索結果と一緒にサムネイルを表示して、見る動画をすばやく決められるようにする。

検索の進化

Google の目標は、ユーザーとそのユーザーが探している情報との間にほぼ途切れのないつながりを確立し、結果をより速く提供することです。この動画では、ユニバーサル検索の結果やスピード アンサーのようないくつかの重要な機能を中心に、検索がどのように進化しているかについてご紹介しています。

アルゴリズムの品質評価テスト: アイデアから実用化まで

一般に、アルゴリズムの変更は、Google のエンジニアが検索を改善する方法についてのアイデアを出すところから始まります。Google では、データ重視のアプローチに従い、提案されたアルゴリズム変更のアイデアすべてで膨大な品質評価を実施してから、実用化に進みます。

エンジニアは、一般的にまず一連のテストを実施し、微調整を行って同僚からフィードバックを得ます。満足する結果が得られて、より大規模なユーザー集団にそのテストを公開できるようになるまで、この作業を繰り返し続けます。

検索品質評価ガイドライン

この資料は検索品質評価ガイドラインの一部です。このガイドラインは、検索評価担当者のトレーニング資料として使用されています。このドキュメントでは、「URL の評価」と呼ばれる評価作業のタイプを中心に説明しています。この作業で、評価担当者は、検索クエリとそのクエリに対して返される可能性がある検索結果を確認します。資料に記載されている基準で、そのクエリに対する検索結果の関連性を評価します。単純な作業のように思えるかもしれませんが、熟慮すべき難しいケースが数多くあります。

今すぐダウンロードする(英語のみ)

テストを絞り込んでアルゴリズムの変更点を実際に実用化するプロセスを示すグラフ

精度の評価

41,831

最初の段階では、検索の品質を評価するためのトレーニングを受けた評価担当者からフィードバックを取得します。評価担当者は検索結果を確認し、その有用性を評価します。注: これらの評価はランキングには直接影響しません

比較テスト

9,250

比較テストでは、評価担当者に対して 2 つの異なる検索結果のセットを提示します。一方には、古いアルゴリズムによる検索結果、もう一方には、新しいアルゴリズムによる検索結果が表示されます。どちらの検索結果をより良いと評価したかについて詳しく確認します。

ライブ トラフィック テスト

7,362

評価担当者のフィードバックが良好な場合は、「ライブ トラフィック テスト」に進みます。このテストでは、実際の Google ユーザーのごく一部の方々の検索を新しいアルゴリズムによるものに変更して、検索結果への反応がどのように変化するかを確認します。結果を慎重に分析し、その変更が検索結果の改善につながっているかどうかを確認します。たとえば、新しい検索結果の上位にあるページをクリックする割合が高ければ、良い傾向であると言えます。

実用化

538

最後に、最も経験豊富な検索エンジニアが、さまざまなテストから得られたすべてのデータを慎重に検討し、その変更点を承認して実用化するかどうかを判断します。膨大な作業量に思えますが、プロセスは洗練されているので、エンジニアは、アイデアが出てからごく少数のユーザーに対する実用化までを 24 時間以内に実現することができます。こうしたテスト、評価、分析のプロセスをもとに、2011 年度は検索に対し 538 件の改善を実用化しました。

2011 年のデータ