Google検索のSSL化によって、Googleのどんなキーワードから流入してきたアクセスなのかということは、基本的にはわからなくなってしまいました。
Referer自体は取れるのですが、そのRefererから明確にわかるのは今のところ検索結果(SERPs)での表示順位くらいです。
昔は検索クエリ(キーワード)を取得出来ました。しかし、リダイレクトを挟む仕様になったこと、そしてSSL化したことで、取得できなくなってしまいました。
取得できるのは、意味不明なパラメータのついたRefererだけなのが現状です。
解析はずっと試みられているが、大きな成果はない
そこで、このRefererに入っているパラメータから何か読み取れないかという試みは以前から行われています。謎の文字列からクエリ情報が取り出せるのではないか?など…。
しかし、きっちり暗号化?されているせいか、せいぜいcdという変数に検索順位が入っているということくらいしか、今のところ分かっていません。(このcdという変数を取得することで、GoogleAnalyticsでGoogleでの検索順位を取得してカスタム変数に入れる、みたいなことができます。
しかし今回、それに加えて一部のパラメータの意味が分かったかもしれません。
もちろんGoogle公式の情報ではないですし、みっちりと検証されているわけではありません。その前提でご紹介します。
記事はこちら。
▼Decoding Google’s Referral String (or, how I surviVED Secure Search) | SEOmoz
前提としてのHTTPリクエスト上の動き
前提として、Googleの検索結果からの動きやHTTPリクエストについて少しまとめます。
今、検索結果から実際のページに遷移する間に挟まっているページ、言い換えるとアクセス解析ツールにRefererとして入ってくるURLは例えば以下のようなものです。
以下の様な流れです。Googleの計測のためかと思います。
[Googleの検索結果(SSL)]→[Google内部でのリダイレクトURL(非SSL)]→[リンク先ページ]
変数のくくりごと改行していますが実際は一行です。
https://www.google.co.jp/url?
sa=t&
rct=j&
q=&
esrc=s&
source=web&
cd=1&
cad=rja&
ved=0CC8QFjAA&
url=http%3A%2F%2Froundup-inc.co.jp%2F&
ei=PH-kUYe0IIjukAWQ9YCoCA&
usg=AFQjCNFo0VoZ7CKyyagFBowLiflWZDp3yQ&
sig2=BolpUH5XStay7Ue6LjjQyw
ちなみに、元々の検索結果のURLはこんなもので
https://www.google.co.jp/search?
q=roundup-consulting&
aq=f&
oq=roundup&
sourceid=chrome&
ie=UTF-8
ここのqという変数の値を取得できたので、昔は流入検索キーワードが分かりました。
ですが今は、その間に先ほどの意味不明なリダイレクトURLを挟んできます、また、SSL→非SSLページなのでブラウザは基本的にはRefererを残さないということもあります。合わせ技です。
故に(not provided)となり、ウェブマスターツールの、ざっくりとしたデータのみに頼ることになっているのが現状です。
パラメータについて分かっていることは殆どない
1年前の記事ですが、いくつかのパラメータについて、恐らくこうではないかということをまとめている記事はいくつかありまいた。例えばこちらです。「Deconstructing Google url search parameters」
この中では
- saはユーザの検索行動に関係しているのではないか(別ソースで、sa=Nは検索結果をクリックした場合、sa=Xは関連検索をクリックした場合などとありますが、sa=tについての情報はなく、また情報の正確性も不明)
- esrc=sは、SSL検索経由だと付与される模様
- source=webはWEB検索だという意味ではない。画像検索だとsource=imageなどになるわけではない。ツールバー経由などか?(でも、FireFoxのツールバー経由でもsource=webでした)
なんていうことがありますが、結局あまり良くわかっていない状況です。
今回注目されたのは「ved」
この謎の文字列であるved、例えば先程の例だと「0CC8QFjAA」のところです。ここに規則性を見つけたとのことです。それがその下の図です。
SearchVerticalの部分が、検索結果でクリックされたエリアでは?
1.QFj = 通常検索
まず「QFj」と入っているものは通常検索結果経由のクリックという意味ではないか?とされています。実際先ほど私がサンプルとして出したものもそうなっています。
2.QqQIw = ニュース欄のテキスト部分では?
以下の部分からクリックされると、QqQIwというパラメータが入るのでは?とされています。(Iは大文字のiでLの小文字ではない)
画像は元記事から転載しています。
例えば「自民党」で検索して出てきたニュースのリンクURLは以下です(一部省略していますが)確かにQqQIwが入っています。
https://www.google.co.jp/url?….&cad=rja&ved=0CFYQqQIwBw&url=h…rklB-g
QpwI = ニュースの画像部分では?
以下の部分です。これも適当なクエリで試してみましたが、いくつか試した範囲では確かに入っていました。
まとめると
調査結果をまとめると以下のようになるようです。
- 通常検索:QFj
- ニュースのテキスト部分:QqQIw
- ニュースのイメージ部分:QpwI
- 画像検索結果の画像:Q9QEw
- 動画のテキスト部分:Qtwlw
- 動画のイメージ部分:QuAIw
- サイトリンク:QjB
- ナレッジグラフのリード画像部分:BEPwd
- ナレッジグラフのノンリード画像部分:BEP4d
- イベント:xxxBE0MGM
どのように使うかというのは、なかなか難しいところですが、多用なコンテンツ形態をとって配信している場合には有効かもしれません。
サイトリンクなどは便利そうですね。
サイトリンク関係の補足
ちなみにサイトリンクの場合の補足ですが、いくつか追加で見てみたのが以下です(これは元記事には記載されていない情報で、私が3〜4サイト見ただけでそれ以上検証していないです)
- いわゆるサイトリンクではなく、検索結果の下に小さく出るminiサイトリンクの場合は恐らく「Q0gI」
- パンくず部分からだと「Q6QU」
GoogleAnalyticsにカスタム変数として取り込むには
これは、Googleの順位を取り込むのと基本的には同じです。フィルタを使います。
具体的には、フィルタの種類を「カスタムフィルタ」にして、アドバンス設定にし
フィールドA → 引用Aを 参照元にして (?|&)(ved)=([^&]*)
フィールドB → 引用Bを 参照元にして (?|&)(cd)=([^&]*)
出力先は カスタム変数 で $A3 – $B3
英語版ですが、以下の画像もご覧下さい。
そして、参照sourceに出力したければ、もう一つフィルターを足します。
あそこの値をいじりたくない方はこちらは行わないほうがいいかと思います。カスタム変数に先ほど入れた値を付記する形なので。
これを行うと、以下のように参照元ソースが先ほどの分類ごとに分かれるようになります。
後はこれをもとにアドバンストセグメントを使って分類してみてみる…というやり方です。
使い道は限定されるが…
正直私の場合は、通常検索の画像部分や動画部分やニュースなどからの流入はほぼゼロ(動画は多少あるかもですが)なので、あまり意味が無いかなと思っています。
しかし、メディア系のサイトでは使い道は大きいかもしれません。特にGoogleにニュースサイト扱いされているサイトなど。
サイトリンクは面白そうですね。
これをきっかけに、もっといろいろなパラメータの意味がわかってくればいいなと思う次第です(でもGoogleが仕様を変えたら…と思うとイタチごっこなので追いすぎるのも切なさそうですね)
中小企業・小規模事業者の方々に向けて、ウェブの活用やホームページの戦略などについてWebコンサルティング、施策代行実施などを行っている、株式会社ラウンドナップ代表取締役の中山陽平です。中小企業のWeb活用をサポートし、そこからの反響獲得を実現させています。→プロフィール詳細はこちらから