外部サイトへの流出を記録しておく

外部サイトへのリンクは、バーチャルページビューとイベントを発行しておくと、トラフィック(流入元)の記録や滞在時間など、いろいろなデータが残せます。複数のドメインを管理しているパターンで、クロスドメインやサブドメインの設定が使えない場合などにも、この外部リンクの計測は代用にならないまでも、参考になると思います。*もちろん、ドメイン関係の設定ができればその方が100倍いいです。
計測タグはこんな感じです。
<a href="hoge.com" onclick='pageTracker._trackEvent("Outbound", this.href, document.location.pathname, 時間値);
pageTracker._trackEvent("/outbound/" + this.href.replace(/https?:///, '');')> 外部リンク</a>

2010-08-06
こっちのヘルプをみると、document.locationでリンクを飛ばして、最後にreturn falseをする風に書いてあって、前のだと計測漏れが出そうなので訂正しました。あと、setTimeoutで100遅らせるとリンクされる前にビーコンが飛んでくれる確度が高まるよう。

<a href="hoge.com" onclick='pageTracker._trackEvent("Outbound", this.href, document.location.pathname, 時間値);
pageTracker._trackEvent("/outbound/" + this.href.replace(/https?:///, '');var a =href;setTimeout(function(){document.location=a.href},100); return false;')> 外部リンク</a>

試してません。詳しくはリンク先のヘルプを。 ただ、こっちのヘルプは訂正まえのパターンなので、、、いいかも。
みたいな感じです。実際は、jQueryなどを使ったりして、一括でeventを登録するタイプが便利ですが、基本は同じです。

レポート画面でのイベントの値の確認

trackEvent_outbound

outbound_linkを選んで、

イベントトラックの値の所には、ページロードからの時間を入れておきました。ページ上での外部離脱までの閲覧時間がでます。

WS000002

平均で15秒で外部リンクされてます。エントリーの冒頭部分のリンクなのでしょうがないです。(リンクされてない場合の閲覧時間も、きっちり分けて出せますが、省きます)

一方、利用状況を見ると、セッションで見た指標が出るので、セッション単位での滞在時間がでます。

WS000004

セッション単位でみると、38分です。計測方法が普通と違うのですが、平均してそれくらいページが開かれて居たことをしめします。外部に離脱しても戻ってきているか、外部リンクが新しいタブで開かれているのかのどちらかです。(* ページビューは、偽造なので実際はこの半分くらいです)

トラフィックデータの確認

簡単には、セカンダリ-ディメンジョンで確認できます。

WS000008

アドバンスセグメントで、イベントのカテゴリ-・アクションでセグメントすれば、しっかりとしたセッション分析ができます。

ページ単位での計測

イベントトラッキングではページ単位の分析はできないのですが、trackPageviewも同時に計測していた場合、そちらでページ遷移?が見られます。

WS000005

途中で、httpを抜いたURLにした為、ページが分かれてますが。下のは離脱したまま還って来てないですが、上のは、スグ(平均5秒)戻ってきていますね。(と言いたいのですが、他のeventTrackの影響っぽいので、たぶん、新しいタブを開いた形の計測になってしまったようです。短くは説明できません)

WS000007 WS000006

ナビゲーションサマリーで見ると、前後が同じページ(リンクされたページ)ですね。

データがしょぼいのですが、ページ遷移データみたいなものも見られます。Google Analtyicsのページ遷移は、ランディングペ-ジ分析なので、今回のバーチャルペ-ジビュ-でのページではデータが見られないです。

WS000009

と言うことで、外部へのリンクの計測に、trackEventとtrackPageviewの両方を使う事で、セッション単位の分析、ページ単位での分析の両方ができる事をみました。

最近になってやっと気づいたのですか、trackEventも使いどころがありそうな気がしてきました。

最後に、カスタムレポートで、ページビューとかユニークユーザー数を出してみました。この通り解釈していいのか不安ですが。

これで終わりです。

WS000010

指標数値の補正とアドバンスセグメント

平均値が出発点になる

サマリ-画面で、いろんな数値を見る時に、多くの数値は平均値が出てきます。平均値に回数を掛ければ、全体の数字が出るわけですから、データをイメージする方法としては、とても合理的です。日常生活でも、平均にするといくら、というのは頻繁に出てきます。僕らは、どれくらいの確率で起きそう?と問われたら、過去の平均を即座に計算します。 webサイトなら、コンバージョン率。どれも、成功したものを試行回数で割った数字=平均値を議論のたたき台にしています。

それで、でてきた平均を元に、サイトには、毎日これくらいのユ-ザが来て、これくらいのペ-ジ数を見てくれると想像します。その後に、トラフィックをチェックしたり、特定ペ-ジの貢献度を分析したり、コンバージョンへの導線を見たりすると思います。

分布データが見れるモノもある

でも、平均は信用ならないので、実際のデータの散らばりぐあいが見たくなる時があります。Google Analyticsでは、個別のセッションがどういったモノかを見る場合は、リピート訪問数(*)にいくのがいいです。ここではリピートセッションに関する情報だけでなく、セッションの滞在時間分布、ページビュー分布が表示されます。あとは、前回セッションからの間隔日数、そのユーザの何回目かの訪問がでます。

*この名前の付け方はヘン(英語の方は:loyalty)だと思います。

分布データからは、中央値とか散らばりとかがわかる

分布データでは、自分の頭の中に、イメ-ジができます。これくらいのセッションが、こうなる、、と。平均値はこうだけど、実際にはこういう感じなのだな、、、とイメージを、ボンヤリながらも自分の記憶に保持する事が可能になります。

でも、言葉抜きのイメ-ジは人には伝えられない

議論したり、blogを書いたりするときには、言葉が大切です。ビジネス度が上がれば上がるほど、言葉・数字以外でなんとかする、、、とはいかなくなります。

平均値を少しはマシな数字にする

なので、なんとか、アウトプットする数字を、分布データ図からのイメージに近づけたいです。

方法としては、外れにある奴には退いてもらうわけです。アドバンスセグメントさんが、やってくれます

指標を使ったアドバンスセグメントの絞り込み

アドバンスセグメントの利用方法としては、ディメンジョン側での絞り込み(トラフィックタイプの限定、特定ページ群でのデータに絞る)事が多いのですが、指標側でも絞り込みが可能になっています。指標数字で、外れに居る奴には退いてもらいましょう。

1. イレギュラーなセッションに退いてもらう

Google Analyticsでは、データの整理が難しいページビューを、特殊なセッションとして処理しているようです。セッション中の外部ドメイン経由の流入を、

  • トラフィックとしては記録
  • コンテンツはなしとする

こういうセッションとして扱うようです。退いてもらうには、コンテンツに関する指標(ペ-ジ別セッション数、ページビュー、閲覧開始数)がゼロで見つけます。

WS000007 WS000008

ペ-ジビュ-、滞在時間などに変化が見られます。(こんなに違うのは、僕のサイトの計測がヘンだからです。普通はほとんど変わらないかもしれません)。

2.ペ-ジビュ-の多いものに退いてもらう

autopagenizeなどで閲覧してもらう時は、実態以上にペ-ジビュ-などが増えます間違いでした。でも、とりあえず、10ペ-ジ以上のものを外しましょう。

もちろん、10ペ-ジ以上のものを見るのもありです。

WS000010 WS000011

若干ですが、平均ペ-ジビュ-に変化がみられました。滞在時間があまり変わらないのは、10ページ以上のセッションが特殊という傍証かもしれません。

3.滞在時間の多いものに退いてもらう

僕のサイトはeventTrackを延々と出し続ける計測方法なので、ページが開いている限りは滞在時間がカウントされます。また、最終ページがカウント対象外になる事もないはずです。ただ、タブ型ブラウザで放置されているのも滞在時間にされているので、そういうのを除けておきます。

advanced_segment_wih_time_on_site WS000013

2割強のセッションが放置されるのは、多いような気がしますが、、、平均PVは、異常値なので、平均ペ-ジ別セッション数を出しますと、1.21(全体), 1.25(20分以下)で、放置セッションを含む全体の方がPVは少なめと、通常の数値とは逆転します。

まとめ

  • 平均値と分布図を見比べる必要性を書きました。
  • セッションに関する情報が、名前がヘンだけど、ユーザー > リピート訪問数 でみるとイイと書きました。
  • 言葉にならない分布図に代わって、平均値で議論するための前提として、外れた値を持つセッションを除外しました。
  • その方法として、アドバンスセグメントの指標で設定をしました。

今回の話は、アクショナブルでもないし、キーパフォ-マンスと直接関連するものでもないのですが、分析するときに、ワーキングメモリーに入る事が多い平均値には、留保を付けておく事の価値を書いたものだと思ってます。

だんだん、書くネタに行き詰まってる証拠かもしれません。(分析、解説記事まで昇華できなかった言い訳です)

ユニークユーザ数の話

Google Analyticsで、何人の人がサイトに来たかを知ろうと思うと、ユーザー > 概要のところで、ユニークユーザーの数字を見ます。指定した期間内での、ユーザー数が見られます。同じ人はダブルカウントしないという意味で、ユニークを使ってるんだと思います。

また、ユーザ > ユーザーの傾向 > ユニークユーザ数 でそのものの数字も見られます(ただし、アドバンスセグメントは無効)

absolute_unique_visitors_in_google_analyticsunique_visitors

2162人のユニークユーザ数。期間は、2009年9月から2010年2月13日ですね。

これで、ユニークユーザ数の話は終わりかもしれないですが、今回は新規ユーザとリピータの違いを見たり、セッション分析とユーザー分析の違いを意識しながら、具体的なサイトのユニークユーザ数をブレイクダウンする方法を解説したいと思います。

まずは、新規ユーザー数の話

新規ユーザーとリピーターという項目では、新規ユーザ(初めてcookieが付与された)として閲覧されたセッション数と、リピーターとして閲覧されたセッション数がでます。どんなユーザーでも、最初に新規ユーザとしてのセッションを一回のみ経験するので、新規ユーザーのセッション数を積み上げると、サイトのユーザ数になります。期間を全期間にして、確認しましょう。

new_visitors_visits_in_google_analytics

新規ユーザでのセッション数。全期間なので、冒頭の図のユニークユーザ数と一致するはず。

2162、2156と少し違いますけど、全期間では、新規ユーザのセッション数 = ユニークユーザ数 です。そうしましょう。

期間別にみたい場合は?

期間を区切って新規ユーザセッション数を見ることは、ユニークユーザ数(全期間でみた)の増加分を見る事になります。

ここでは、区切るというか、時系列でみてみましょう。アドバンスセグメントで、新規セッション数と全体を同時に見ます。見易いように週単位にします。(ユニークユーザ数の事は忘れてください、新規ユーザセッション数です)

advanced_segment_new_visits_in_google_analytics

黄色の部分の折れ線グラフ(新規ユーザとしてのセッション数)が、新規閲覧者獲得状況を示す事になります。

新規ユーザとリピーターの比率などの生かし方は、できる100ワザGoogle Analyticsなどに、目安の比率などがあります。

流入別に見たい場合は?

トラフィックの項目で獲得状況を見て、広告やSEO担当の人と、コンテンツ担当の人とで議論すれば、KPIの策定につながるかもしれません。

WS000007 WS000008

検索エンジンや、キャンペーンでの、新規ユーザ獲得数の状況。

ページ別に見る場合は?

ページ別での新規ユーザ獲得状況は、閲覧開始ページにいって、ユーザの種類をセカンダリーディメンジョンにして、アドバンスフィルターで、新規ユーザに絞ります。(上と同じようにアドバンスセグメントでもOKですが、趣向を変えました)

how_many_you_acquire_new_visitors

これで、ページ別の新規ユーザ獲得数が出ます。個別ページに絞っての時系列表示は、カスタムレポートまでやれば、いけますが、ここでは省略します。

グラフでなく、数字が欲しい場合は、ユーザー > ユーザーの傾向 > セッション数で、アドバンスセグメントで、新規ユーザにして、データをDownLoadしましょう。(日単位、週単位、月単位で出来ます)。冒頭で見たように、ユニークユーザー数はアドバンスセグメントで切る事ができません。

WS000006

一方、リピートユーザのセッション数は、そのままではリピートユーザ数にはなりませんね。

どうしましょうか? 実は、カスタムレポートに行くと、ユーザ数とユニークユーザ数という指標が用意されてます。

2009年の10月に導入されたもので、いままでセグメントした場合には見られなかった指標です。

http://www.marketmotive.com/training/tutorials/web-analytics/google-analytics-tracking-unique-visitors.html

(ここで、Avinashの簡単なuniqueVisitorsの紹介があるけど、本編は有料なので、見てません)

ユーザ数? ユニークユーザ数?

カスタムレポートの二つのユーザ指標のうち、ユーザ数は意味不明です。

strange_number_in_visitors_in_google_analytics

上図のように、ユーザ数は期間以外のディメンジョンに対応しない(リピートセッションだとゼロになってしまう)。かといって、期間での集計数字でユニークユーザ数との違いがわかりません。期間別のユーザ数?のみが出せるもの? 何か知っている方がいたら、教えて下さい。

一方、ユニークユーザ数は、上の同じ公式blogのコメントの中で、

Unique Visitor Metric: Now when you create a Custom Report, you can select Unique Visitors as a metric against any dimensions in Google Analytics. This allows marketers to see how many actual visitors (unique cookies) make up any user-defined segment.(どのディメンジョンでも、ユニークユーザ数が出せる)

と言ってます。

やっていきましょう。以後、ユニークユーザ数は、指定した期間での、指定したディメンジョンで集計したユーザ数という事で話しを進めます。

ページ別に見たユニークユーザ数

unique_visitors_in_custom_reporting

直近一ヶ月を期間にして、ページ別に見たユニークユーザ数、及びその他の指標です。ページの詳細にいきましょう。

WS000014

個別のページをクリックして、その後で、新規ユーザセッションと、リピータのセッションにわけましょう。

unique_visitors_with_custom_reporting

(二つの折れ線グラフにしたんですが、二つの線のスケール(両側の赤枠)が違うので、あまり意味ないですね、、、)

ここで気を付けたいのは、ユニークユーザ数は、新規セッションとリピータセッションでは、そのまま分かれないという事です。新規ユーザセッションを経験して、この集計期間内に再度訪問する場合は、リピータセッションになりますので、一人の人が新規セッションでのユニークユーザと、レピータセッションでのユニークユーザにカウントされます。

全体では36人、新規ユーザセッションでは31人、リピータセッションでは9人(図の赤枠)を、違う形の3つのグループに括り直します

  1. 27人が、新規ユーザで来て、二回目は無かった       (31) – ((31+9) – (36))
  2. 4人が、  新規ユーザで来て、二回目以上があった    ((31+9) – (36))
  3. 5人が、  以前に来てて(このページ以外でも)、今回、一回は来た人  (9) – ((36+9) – (36))

という分類にします。

こうすると、2の4人が、新規獲得読者(他のページでの新規かも知れない)で、短い間隔でもう一度来た人だとわかります。

閲覧開始ページをディメンジョンにした方が、ページを軸にした分析に向いてるかもしれないですね。そっちも見てみます。

WS000021

全体32人、新規27人、リピータセッション7人ですね、同じように違う形の3グループで括り直すと

  1. 25人が、新規ユーザで来て、二回目は無かった。(27) – ((27+7) – 32))
  2. 2人が、  新規ユーザで来て、二回目以上があった。 ((27+7) – 32))
  3. 5人が、以前に来てて(このページ以外でも)、今回一回以上はあった。(7) – ((27+7) – 32)

ページと閲覧開始を比べると、4人(1:(27-25),2:(4-2))の新規ユーザは違うページからこのページに来て、二人(4-2)は再来訪者になったことがわかります

ページ(ランディングか、通しのページかの両方)で集計した、新規ユーザ(期間内再来訪なし、あり)、前の期間から再来訪者で分けて、ユーザ像をイメージしました。

トラフィック別に見たユニークユーザ数

WS000022

同じ指標で、ディメンジョンを参照元に代えました。

キーワードにドリルダウンしていって、setcustomvarを選びました。

unique_visitors_with_a_keyword

今度は、全体のユニークユーザ数 = 新規ユーザセッションでのユーザ数 + レピータセッションでのユーザ数です。

“setcustomVar”で獲得した新規ユーザは、だれもリピータに転換していないという事ですね。書いた記事の内容が悪そうです。犯人を追及するために、セカンダリーディメンジョンで閲覧開始ページをみます。

WS000024

ずいぶん、昔に書いた奴です。最近書いたsetCustomVarの記事じゃないです。SEOに問題がありそうです。昔書いた奴でなく、最近の書いたsetCustomVarに関する記事なら、、、と思うのですが、、検索流入数も下がってます。リピータの獲得にも失敗し、最近の記事も上位表示されてないという事かもしれないです。検索ボリュームは、下がってないと考えます。SEO対策の記事は書けないので、これで閉めます。

まとめ

  1. ユニークユーザという期間で見たユーザ数の指標が有ることを確認しました。
  2. 新規ユーザセッションの数字は、ある期間での新規ユーザ獲得数になる事を見ました。また、全期間だと新規ユーザセッション数=(アブソルート)ユニークユーザ数(absolute unique visitors)という事も確認しました。
  3. ページ別、閲覧開始ページ別で、新規ユーザからのリピータ転換ユニークユーザ数をみました。
  4. また、キーワード別でも同様の転換ユーザ数をみました。

オマケ

  1. 新規ユーザのリピータ転換は、アドバンスセグメントで、recencyとセッション数を元にセグメントすれば、似たような数字がでると思います。ただ、ユニークユーザ数の全体の数字から、新規セッション、リピータセッションにセグメントして、ユニークユーザ数を出すと、全体的なイメージがつかみ易いと思います。

カスタム変数で試行錯誤した

2010/02/23 このサイトのカテゴリ名をペ-ジスコ-プに入れて見てたのですが、どうやら、ペ-ジビュ-はキチンとした数字になってるようです(閲覧開始と離脱も良さそう)。他の指標は、セッションレベルの指標なので、無視すればいいと思いました。下の話は、その辺りが分かってないまま書いたという事で、お願いします。(* ペ-ジスコ-プなのに、ペ-ジ別セッションを見てました、、、ごめんなさい。)

2010/02/02 17:25 少し修正しました。

Google Analtyicsにカスタム変数が導入されて数ヶ月経った。未だに???なので、試行錯誤してみた。

まず、公式の文書は、http://code.google.com/apis/analytics/docs/tracking/gaTrackingCustomVariables.html

読んでも、よく分からない。文が英語のせいだけではないはず。なぜなら、日経BPのGoogle Analyticsは、Google Analtyicsのhelpの英語の説明を丁寧に説明してくれてる本なんだけど、それを読んでも良く分からなかったから。(*日経BPのGA本について書いた別の記事)

自分で試さないからだよ、と天の声に従い、試行錯誤した。

疑問点

  • カスタム変数をレポートで見ると、指標としてはセッション数とか出る。
    • これとスコープの話(ページ、セッション、ユーザレベル)の話がイメージしづらい。
  • 同じindexを使うと、値が上書きされるらしい(そのセッションが、そのカスタム変数の値になるという事?)
    • でも、スコープが違うと、そうじゃ無い場合もある。
  • 複数のindexを同じセッションで使うと、どういう知見が得られるか? がイメージしづらい。

解消のための行動方針

  • 同じセッション内で、カスタム変数の値を上書きしまくる。
    • 条件
      • スコープの違い
      • 上書きのタイミング
  • 同じセッション内で、複数のindexを同時に使う。

実際の設定

  • まず、a.html, b.html, c.htmlの3つのファイルを用意。
  • a → b → c と閲覧する
  • それぞれで、indexの1,2にカスタム変数を当てていく。

具体的な設定と結果

設定部分:表の水色部分です。

結果: 赤の部分より下です

*結果について)   通常のレポート画面(+アドバンスセグメント)だと、複数のカスタム変数を合わせた上での指標数値は出せないようです。カスタムレポートなら、サブディメンジョンで複数のカスタム変数で降りて見られます。今回はData export apiで出した数値です。
別ページで開きたい方はこちら

別ページで開きたい方はこちら

(Data Export API Explorerで出しました dynamicセグメントは便利です)

WS000004

得られた事

  • ユーザレベルの上書きは、上書き前と後のセッションが、それぞれ提示されている
  • ページスコープの上書きは、セッション最後の値(ページ最後ではなく)しか記憶されない?
    • だとすると、ページレベルとセッションレベルが分かれている、その存在理由が分からない。
    • 僕の結果の指標数値の出し方に問題があるのか???
  • なぜか、ページビューが2倍になってカウントされている。(pagepathで値を見ると、a → a… cとなっているので、a,a,b,b,c,cとなっていそう)

やっぱり、ページレベルの変数設定は、このままでは使えない。何かがおかしい、、、、