米国時間9月4日、日本時間では9月5日、米D.C.連邦地裁が、Googleを巡る独占禁止法訴訟についての判決文「Memorandum Opinion」を公開しました。
文書番号は1436。主な内容は、「検索・Chromeなどの配布に関する排他的な契約を禁止」「Chromeの分割は必要ないという判断」「検索インデックスやユーザーインタラクションのデータを一定範囲で共有する義務」
一次資料と言えるでしょう。
出典:United States v. Google LLC Memorandum Opinion (Document 1436)
ここでは、SEOの文脈の部分だけピックアップします。
これだけで「ああだこうだ」という話ではないのですが、初出の用語などもあリ共通言語としておさえておくと分かりやすくなるかもしれません。
SEOやWeb運用の現場では,薄々分かっていたこと…かもしれませんが、改めて示されたことで、諸処に使いやすい情報かなと思います。
今回の判決文から押さえるべきポイント
ひとことで言えば「Googleがどのようなデータをどんな目的で使い、検索エンジンや生成AIにどのように組み込んでいるかが、具体的に分かった」と言う点かと思います。何かもの凄く大きな発見があったという印象ではないです。
-
- ユーザー行動データの重要性が明確に
クロール優先度、インデックスの鮮度管理、ランキング調整、そしてプロダクト評価、Googleが検索エンジンの多くのプロセスでユーザー行動データを継続的に活用していることが判決文で明らかになりました。
これは検索品質の向上を支える重要な要素となっています言いかえると、クリック率や滞在だけでなく「タスク完了感」の設計(情報到達の短径化、内部導線、FAQ・ステップ)が重要と思われます。ランディング後の満足度が伴わなければ、クリック率だけを上げる短絡的施策は、マイナスの影響が大きいわけですね。
- Google内部のコードネームが多数公開され、理解が深まる
Navboost、GLUE、RankEmbed、FastSearch、MAGITなど、これまで言葉の端には出ていても不明確だったGoogle社内での呼称や各アルゴリズムの役割、これが判決文公開によって整理されました。
これにより、検索と生成AIの関係性が理解しやすくなりました。名前が分かったから何だという話でもありますが、共通言語が出来るとわかりやすいのは良いことかなと思います。
- ユーザー行動データの重要性が明確に
Googleの内部コードネームの詳細とその役割
判決文に書かれた情報をもとに各コードネームについてまとめました、備忘録も兼ねて。
今回出てきたコードネームはAIに関係している物と、もともとGoogleが使っていたランキングに関わる物とに分かれます。全体として以下の様なイメージを持って頂くと良いのではと思います。(※ここは推測です)
-
検索スタック(全体のランキングに関わる部分)関連
クエリ理解→内部からの候補の取得→スコアリングしてランキング付け→(必要なら)AIOの起動判断までを担当。ここで使われるのがRankBrain / DeepRank / RankEmbed(BERT) や Navboost / Glue / Tangram -
AI mode(AI Overviews)の生成関連
MAGIT(モデル群)+カスタムGemini。検索シグナルやインデックスに基づいてグラウンディングして出力を作る。RankBrain のような検索側モデルのシグナルもAIまわりに適用される
全体のプロジェクト名が Project MAGI
元々は、生成AIをGoogle検索に統合する社内プロジェクト名です。検索エンジンの新しい体験(≓AI mode)を支える基盤技術を扱うプロジェクト。
2023年にはすでに広報されており別に隠されていたわけではないです(それ以前はともかく)SGE(検索生成エクスペリエンス)が結果としてMagi計画の最初の成果物、そして様々な生成AIアイデアを取り入れ、最終的に「AI Overviews」機能として実現したと考えられます。
後述するMAGIT(マギット)は、AIOの生成テキストを出す「中核モデル(群)」という関係ですね。
AI出力に関わるもの
MAGIT(マギット)とは
検索データと要約のための指示(プロンプト)情報を元に、AI Overviewsの自然な文章を生成するカスタムモデルです。
Gemini基盤モデルを、検索用のAI要約に最適化していると記載されています。
検索データを使って調整を繰り返しており、ここの調整がアルゴリズムに大きく関連しそうですね。
基盤モデルの事前学習にはクリックやクエリデータを使用していない、と記載されているのですが、あくまで基盤なので、それをユーザー行動を元に随時カスタムしていくというくわけです。判決資料にも後述のGLUEが調整に使われているとあります。
頭字語の意味(何の略か)や内部構成の詳細については情報はありません。
AIに限らないもの(検索ランカー群)
以下はAIに限らずGoogleが検索システム全体で使っている物です。旧来の検索結果を構成するアルゴリズムに含まれる物とも言えます。AI Overview が出る場合もAIO以外の部分はここが担当します。
GLUE(super query log)とは
Google検索の内部で使われる、その名の通り「超・検索行動ログ」です。具体的には検索結果上での「クエリ内容、端末情報、クリックやホバー、スクロール、スペル訂正など検索時の挙動全般を集約したログ」です。後述のNavboostのデータも含まれます。
約13か月ぶんという長いスパンでテーブルに集約、ランキングシグナルとして使う土台データと記載があります。13ヶ月というのは恐らく季節要因なども含めて判断したいからではないでしょうか。
一次資料: DOJ提出資料は、GLUEが「13か月」のユーザー側挙動を集約する“super query log”であることを示します(Clicks / Hovers / Scrolls など)。
Googleはユーザー行動を評価軸として非常に重要視しているため、詳細なデータを取っているのでしょう。
AI mode / AI Overview だけではなく、従来の検索タブにおいても、この Glue 由来の信号は重要入力とされています。なので、AI云々に限らずGoogleの考える「判断軸」のメインなのでしょう。品質評価ガイドラインでのクオリティレイターの判断基準もそうですよね。
※NLPベンチマークのGLUE / SuperGLUEとは無関係です
Navboost(NavBoost)とは
「クエリ×結果へのクリック行動」を収集したデータです。直近13ヶ月分のデータを使用。GLUEと被るようですが、先にNavBoostがあり、それを含めて包括的に広くデータを取るようになり、GLUEとなった考えるのが妥当かと思います。
“Navboost—one of the most powerful ranking components at Google—memorizes all clicks for all queries received in the prior 13 months.”
Googleは今回の裁判資料においてNavBoostは「非常に重要なランク要素」と記載しています。Glueで取っているデータの中で、重み付けが最も大きいのがNavBoostで取得しているクリック行動だということでしょう。
NavBoostは名前含めかなり昔から話題になっています。
具体的には、2005年の時点で「Google検索に組み込まれている根幹システムで、検索クエリに対するユーザーのクリック・閲覧・離脱などの挙動を記録し、次回以降の同様検索の順位改善に反映している」と言われています。
RankEmbed/RankEmbedBERTとは
Google検索の深層学習ランクモデルで、深層学習によるシグナルを出します。「トップレベルシグナル」と記載があるので、重要度は高いと思われます。
約70日間のログデータと品質評価者(クオリティレイター)のスコアによって学習させ、より深く意図や目的を理解して調整する役割と言えるでしょう。特にロングテールクエリでの品質アップに効果が出ているとされています。(※“約70日”は二次情報。一次資料で日数は明確でないです)
FastSearchとは
MAGITから求められた際、検索グラウンディング専用の高速回答を生成するものです。検索ランキング用のシグナル群(RankEmbed)を使って、短く要約された順位付きウェブ結果を素早く返す事に特化しています。
“FastSearch is based on RankEmbed signals …”
— U.S. v. Google, Memorandum Opinion, Doc. 1436, Rem. Tr. 3509:23–3511:4(Reid証言参照), p.40/230 付近<
判決文では、FastSearchは「返す文書をしぼるので速いが、Search(通常のフルランキング)より品質は低い」と認定しています。
“Google does not make FastSearch directly available to third parties through an API.”
— U.S. v. Google, Memorandum Opinion, Doc. 1436, Rem. Tr. 3512:1–5, p.40/230 付近
判決文はあわせて、GoogleがVertex経由での“グラウンディング”提供に契約上の制限を設けている点にも触れています。
“Fast Search is [RankEmbed] plus a few minor additions on top of it.”
— Defendant’s Proposed Findings of Fact (Remedies), Doc. 1373, ¶873, Tr. 2816:21–17:12(Allan)
スピード優先なので、スパムにやられやすいとも言われていますね。また、バックリンク等の重み付けをあまり行っていないという説もアリAI Overviewと従来の検索結果部分の差が出る1つの要因かも知れません。
GCC(Google Common Corpus)/Docjoinsとは
Geminiモデルの事前学習に使われる大規模ウェブコーパス(Google Common Corpus)とその管理システム(Docjoins)。Common Crawlより大規模。検索のメタデータやシグナル(集計されたユーザー行動由来を含む)が入るとされています。詳細は文書に記載はありません。
それ以外
Gemini Nano/AICoreとは
端末上で動作する小型LLM(Gemini Nano)と、その実行環境(AICore)。高速推論が特徴です。直接SEOに関係する物ではないのですが、付記します。
開発用資料のこちらを見て頂くのが早いかと思います。
https://developers.google.com/solutions/pages/android-with-ai?hl=ja
Gemini Nano は、デバイス上での実行に最適化された Gemini ファミリーのモデルです。AICore を介して Android OS に直接統合されています。これにより、ネットワーク接続やクラウドへのデータ送信を行うことなく、生成 AI エクスペリエンスを提供できます。
Vertex AI(Search grounding)とは
既存の社内検索や外部検索サービスをGeminiに接続し、自社データに基づく回答を作らせるもの。サードパーティがGoogle検索や他データでグラウンディングできるクラウド機能。ちなみにFastSearchはVertexでは使われません。
Google検索の観点では、公開Webの最新情報を検索して引用付きで回答させる機能を担当しています。
“Google does not make FastSearch directly available to third parties through an API.”
Vertex AI Platform | Google Cloud
https://cloud.google.com/vertex-ai?hl=ja
ユーザー行動データ活用のポイント
Googleでの露出要因としてユーザー行動は想像以上に重要
検索品質を支える重要な要素として、ユーザー行動が位置付けられています。
- Googleはクリック/滞在/戻りなどの行動ログを長期保持(NavBoostは原則13か月)し、ランキングやインデックス運用、鮮度維持に反映
- 「良いクリック」「悪いクリック」「最後に最も長く閲覧されたクリック」などで満足度を推定し、次回の順位調整に活用
- リアルタイムな動き(ニュース等の急変時)などはGlue、文脈セグメントはSlicesが担う、と位置づけ
クリックの質、最後に長く閲覧された結果、滞在時間や戻り率、SERP上でのホバーやスクロールなどの微細な挙動データがGoogleのランキング調整や検索品質の判断材料となっています。
ユーザー行動は幅広く使われている
また、特にモバイル環境でのローカル検索、ロングテールクエリや新しいトピックに関する検索精度向上にも活用されています。
実務上の対策としては、直帰や短期離脱を減らし、ユーザーの回遊や滞在を増やすためのコンテンツ設計、構造化データの整備、要点を簡潔にまとめた情報提示等の方向だと思います。
なので、AI要約機能に採用されやすいコンテンツ構造やFAQの整備も重要なポイントとなります。この辺りはインスタントに提案されガチですが、一定の価値はありそうですね。
有名なPageRankは“既知の良質源からの距離という単一信号”として補助的に扱われているだけで、ユーザー行動データに比べると、重要度が低いのではと言う印象です。
まとめ
今回の判決文により、Googleがユーザー行動を中心に置いた検索エンジン設計をしていることが明確になりました。
SEOやWeb運用の現場では,薄々分かっていたこと…ではあるのですが、改めて示されたと言うことで、諸処に使いやすい情報かなと思います。ただ、名前が分かったから何だという話でもありますが、共通言語が出来るとわかりやすいのは良いことかなと思います。
参考ページ
- 投稿 | LinkedIn(Ryan JonesRyan Jones)
https://www.linkedin.com/posts/jonesy_this-is-interesting-and-confirms-both-what-activity-7368998229180305410-zIoR/ - Google Antitrust Case: AI Overviews Use FastSearch, Not Links
https://www.searchenginejournal.com/google-antitrust-case-ai-overviews-use-fastsearch-not-links/555220/ - U.S. v. Google, Memorandum Opinion, Document 1436, filed .(FastSearchの性質、品質、API提供) Justiaミラー。
- Google(被告)提出:Proposed Findings of Fact (Search Remedy Trial), Document 1373, filed .(“Fast Search is [RankEmbed] plus …”) PDF。