指標数値の補正とアドバンスセグメント

平均値が出発点になる

サマリ-画面で、いろんな数値を見る時に、多くの数値は平均値が出てきます。平均値に回数を掛ければ、全体の数字が出るわけですから、データをイメージする方法としては、とても合理的です。日常生活でも、平均にするといくら、というのは頻繁に出てきます。僕らは、どれくらいの確率で起きそう?と問われたら、過去の平均を即座に計算します。 webサイトなら、コンバージョン率。どれも、成功したものを試行回数で割った数字=平均値を議論のたたき台にしています。

それで、でてきた平均を元に、サイトには、毎日これくらいのユ-ザが来て、これくらいのペ-ジ数を見てくれると想像します。その後に、トラフィックをチェックしたり、特定ペ-ジの貢献度を分析したり、コンバージョンへの導線を見たりすると思います。

分布データが見れるモノもある

でも、平均は信用ならないので、実際のデータの散らばりぐあいが見たくなる時があります。Google Analyticsでは、個別のセッションがどういったモノかを見る場合は、リピート訪問数(*)にいくのがいいです。ここではリピートセッションに関する情報だけでなく、セッションの滞在時間分布、ページビュー分布が表示されます。あとは、前回セッションからの間隔日数、そのユーザの何回目かの訪問がでます。

*この名前の付け方はヘン(英語の方は:loyalty)だと思います。

分布データからは、中央値とか散らばりとかがわかる

分布データでは、自分の頭の中に、イメ-ジができます。これくらいのセッションが、こうなる、、と。平均値はこうだけど、実際にはこういう感じなのだな、、、とイメージを、ボンヤリながらも自分の記憶に保持する事が可能になります。

でも、言葉抜きのイメ-ジは人には伝えられない

議論したり、blogを書いたりするときには、言葉が大切です。ビジネス度が上がれば上がるほど、言葉・数字以外でなんとかする、、、とはいかなくなります。

平均値を少しはマシな数字にする

なので、なんとか、アウトプットする数字を、分布データ図からのイメージに近づけたいです。

方法としては、外れにある奴には退いてもらうわけです。アドバンスセグメントさんが、やってくれます

指標を使ったアドバンスセグメントの絞り込み

アドバンスセグメントの利用方法としては、ディメンジョン側での絞り込み(トラフィックタイプの限定、特定ページ群でのデータに絞る)事が多いのですが、指標側でも絞り込みが可能になっています。指標数字で、外れに居る奴には退いてもらいましょう。

1. イレギュラーなセッションに退いてもらう

Google Analyticsでは、データの整理が難しいページビューを、特殊なセッションとして処理しているようです。セッション中の外部ドメイン経由の流入を、

  • トラフィックとしては記録
  • コンテンツはなしとする

こういうセッションとして扱うようです。退いてもらうには、コンテンツに関する指標(ペ-ジ別セッション数、ページビュー、閲覧開始数)がゼロで見つけます。

WS000007 WS000008

ペ-ジビュ-、滞在時間などに変化が見られます。(こんなに違うのは、僕のサイトの計測がヘンだからです。普通はほとんど変わらないかもしれません)。

2.ペ-ジビュ-の多いものに退いてもらう

autopagenizeなどで閲覧してもらう時は、実態以上にペ-ジビュ-などが増えます間違いでした。でも、とりあえず、10ペ-ジ以上のものを外しましょう。

もちろん、10ペ-ジ以上のものを見るのもありです。

WS000010 WS000011

若干ですが、平均ペ-ジビュ-に変化がみられました。滞在時間があまり変わらないのは、10ページ以上のセッションが特殊という傍証かもしれません。

3.滞在時間の多いものに退いてもらう

僕のサイトはeventTrackを延々と出し続ける計測方法なので、ページが開いている限りは滞在時間がカウントされます。また、最終ページがカウント対象外になる事もないはずです。ただ、タブ型ブラウザで放置されているのも滞在時間にされているので、そういうのを除けておきます。

advanced_segment_wih_time_on_site WS000013

2割強のセッションが放置されるのは、多いような気がしますが、、、平均PVは、異常値なので、平均ペ-ジ別セッション数を出しますと、1.21(全体), 1.25(20分以下)で、放置セッションを含む全体の方がPVは少なめと、通常の数値とは逆転します。

まとめ

  • 平均値と分布図を見比べる必要性を書きました。
  • セッションに関する情報が、名前がヘンだけど、ユーザー > リピート訪問数 でみるとイイと書きました。
  • 言葉にならない分布図に代わって、平均値で議論するための前提として、外れた値を持つセッションを除外しました。
  • その方法として、アドバンスセグメントの指標で設定をしました。

今回の話は、アクショナブルでもないし、キーパフォ-マンスと直接関連するものでもないのですが、分析するときに、ワーキングメモリーに入る事が多い平均値には、留保を付けておく事の価値を書いたものだと思ってます。

だんだん、書くネタに行き詰まってる証拠かもしれません。(分析、解説記事まで昇華できなかった言い訳です)

コメントを残す