コンバージョン率の推定範囲を把握しておく


* 正規分布で近似できるのは、np>5 だそうなので、100回施行で5回コンバージョンが想定されるくらいから、正規表現のイメージ(偏差*2で95%範囲)を持てるという事。でいいと思う、、、100回で2%だと、np<5なので、より裾野が広いイメージ?というか、コンバージョン数が0, 1, 2, 3, 4, 5, 6 くらいまでをそれぞれ計算すれば、いいと思います。 一般的には、F分布(謎)を使うようです。

————————————————————————————————————————————-

アクセス解析はなんですか? と聞かれた時に、よくある答えは、コンバージョンレートを計測し、向上策を考える事です。 というのはよくある答えですし、実際、サイトの数字を見るときは、まず、コンバージョンレートを見るようにしてます。

それで、これとこれのコンバージョンレートが違いますね。という話になると思います。比較の対象は、期間の比較であったり、キーワード、メディア、ランディングページの違いだったりすると思います。

どれくらい数字が違えば、認識・行動に移れるのか?

イメージから行動に移るには、数字の差が ”たまたま” なのか、”構造的” なのかを把握しないといけません。上の表は、標準偏差が ”1 or 2”の範囲で、どれくらいかを示したものです。正規分布を仮定しているので、この上下の範囲に64%が入る事になります。2の範囲で95%です。

意思決定的には、8割方の感覚でいけばいいと思います。また、コンバージョンレートの比較といっても、あくまで、それぞれのセッションを平等に扱って考えているわけで、選んだセッションに偏りがあると考える方が妥当かもしれません。 その場合は、因子分析に移ればいいのだろうか??? だれか、手順書を書いて欲しい。

数字を見る

WS000002

閲覧開始ページ別のコンバージョンレートです。タブの名前は、遊びで創ったもので、他のだれかがこの数字を担当してるわけではありません。

今回は、5ページ以上見るをコンバージョンとしています。ここでは、平均ページビューがだせないのですが、サイト全体の平均ページビューは、2.3くらいです。

上の表を使ってみると、トップページのコンバージョン率は、10.47%ですが、7-13%くらいまでは、振れを見といた方が良さそうです。 近い数字で、businessのページは、9.41%ですが、開始数が85なので、5-13%くらいの範囲を想定しないといけないです。what_areのページも、6.09%ですが、3-10%くらい違うと、、、

まあ、2シグマで見てたら、違いが分かる人にはなれそうにないのですが、閲覧開始数がこの10倍あれば、偏差はルート10で、3分の1くらいになるので、7-13が、9-11くらいの範囲になって、違いが言えるようになると思います。このサイトは、一日のアクセスが30-50なので、この10倍くらいのサイトなら、それなりに2,3パーセントの違いに言及できるようになると思います。

google analtyicsでは、インテリジェンスで統計数字が出てきて、アラートを出してくれるのですが、指標を時系列分析やら、誤差項やらを入れて、分析してそうな気がしますが、たぶん、説明を受けてもわかりそうにないです。

とりあえず、コンバージョンしたかどうかの、二者択一についての数字の分布を想定して、数字の振れをイメージしておきましょうという話でした。 間違っていたら、コメントください。 統計の話は、理解・非理解の二者択一なので、コメントにうまく返答出来ないかもしれませんが。

大事なのは、アクションなのですが、数字に統計的な違いがあるといえば、アクションさせる力になると思います。