<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Google Analytics アクセス解析</title>
	<atom:link href="http://abc-analytics.com/feed" rel="self" type="application/rss+xml" />
	<link>http://abc-analytics.com</link>
	<description>実践メモ、解説、疑問点の表明、データの見方</description>
	<lastBuildDate>Tue, 09 Mar 2010 19:01:06 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>参照元、参照サイトの日別データを取る</title>
		<link>http://abc-analytics.com/referral_data_against_date</link>
		<comments>http://abc-analytics.com/referral_data_against_date#comments</comments>
		<pubDate>Tue, 09 Mar 2010 18:35:30 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[解説]]></category>
		<category><![CDATA[apps script]]></category>
		<category><![CDATA[アドバンスフィルター]]></category>
		<category><![CDATA[カスタムレポート]]></category>
		<category><![CDATA[日別データ]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/daily_basis_data_for_referrals</guid>
		<description><![CDATA[google analyticsで、カスタムレポートを使い、一日単位の参照元情報をエクセルなどに落とす作業の説明。さらに、参照サイトと参照ＵＲＬとデータが分かれていてデータが同時に出せないので、Data Export APIを使って同時に出す説明。]]></description>
			<content:encoded><![CDATA[<p><a href="http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1137761571">yahoo知恵袋の質問</a>を見てたら、一日単位のリファラー(参照サイト？)が取りたいという質問があって、確かに欲しいデータだなと思ったので、手順を書きます。使うのは、カスタムレポートとセカンダリ－ディメンジョンの二つです。最後に、エクセル出力です。</p>
<h3>カスタムレポート作成</h3>
<p>ディメンジョンを日別にします。指標は、閲覧開始数、滞在時間、直帰率にしておきます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000000.jpg"><img style="display: inline; border-width: 0px;" title="カスタムレポート日別データ" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000000_thumb.jpg" border="0" alt="カスタムレポート日別データ" width="239" height="244" /></a></p>
<p>サブディメンジョンは入れてもいいですが、入れなくてもいいです。とりあえず使いません。</p>
<p>レポートに戻ったら、セカンダリ－ディメンジョンを参照元にします。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000002.jpg"><img style="display: inline; border-width: 0px;" title="日別データ　カスタムレポーティング" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000002_thumb.jpg" border="0" alt="日別データ　カスタムレポーティング" width="544" height="221" /></a></p>
<p>これで、参照元のセッション数、平均対座時感、直帰率がでました。<strong>でも、検索エンジンはいらないですよね</strong>。</p>
<p>検索エンジンと直帰をしたセッションをアドバンスフィルターで除きます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000003.jpg"><img style="display: inline; border-width: 0px;" title="WS000003" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000003_thumb.jpg" border="0" alt="WS000003" width="544" height="203" /></a></p>
<p>セカンダリ－ディメンジョンの参照元で絞り込みます。&#8221;文字を含まない&#8221; で、google|direct|yahoo|reader とします。</p>
<p>(*他のキャンペーンなども必要に応じて除いてもいいですし、最後のエクセルで除去してもいいです)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000004.jpg"><img style="display: inline; border-width: 0px;" title="アドバンスフィルターを適用" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000004_thumb.jpg" border="0" alt="アドバンスフィルターを適用" width="244" height="234" /></a></p>
<p>フィルタリングできました。</p>
<p>これをファイルにエクスポートして、エクセルで開いてピボットにします。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000006.jpg"><img style="display: inline; border-width: 0px;" title="WS000006" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000006_thumb.jpg" border="0" alt="WS000006" width="244" height="187" /></a></p>
<p>すかすかですが、エクセル上なので、データの絞り込みなどは容易だと思います。</p>
<p>このエクセルは試用版ですが、スライサーというのを使うと、</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000007.jpg"><img style="display: inline; border-width: 0px;" title="エクセル　スライサー" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000007_thumb.jpg" border="0" alt="エクセル　スライサー" width="244" height="220" /></a></p>
<p>フィールドを個別に選びながら表示できました。さすがエクセルですね。</p>
<h3><strong>参照サイトはわかったけど、そのサイトの&#8221;<span style="text-decoration: underline;">どのページ</span>&#8220;から来たか分からないじゃないか？</strong></h3>
<p>ですよね。カスタムレポート作り直しましょう。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000008.jpg"><img style="display: inline; border-width: 0px;" title="カスタムレポート　参照ＵＲＬ" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000008_thumb.jpg" border="0" alt="カスタムレポート　参照ＵＲＬ" width="244" height="150" /></a></p>
<p><strong>サブディメンジョン</strong>に<strong>参照ＵＲＬ</strong>を加えて、レポートを出した後に、<strong>特定の日を押すと(下図では3月１日)</strong></p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000010.jpg"><img style="display: inline; border-width: 0px;" title="WS000010" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000010_thumb.jpg" border="0" alt="WS000010" width="244" height="193" /></a></p>
<p>データはでましたが、<strong>今度はドメイン名が出てないです</strong>。。。参照ＵＲＬは、&#8221;/&#8221; 以降の部分しか表示しません。(その場合、参照URLという名前でいいのだろうか？？？)</p>
<p><strong>もちろん参照元　&gt; 参照ＵＲＬという形でカスタムレポ－トのディメンジョンを組み立てれば、クリックして特定のサイトのページ名はだせます。しかし</strong>、特定の日 &gt; 特定のドメインで、そこに限定された参照ＵＲＬが見られるだけです。という事は、<strong>一括した形でデータをエクセルに落とす事もできません</strong>。一日ごと  &gt; サイトごと&gt; にやればいいのですが、大変です。</p>
<h3>Data Export APIを使う</h3>
<h4>Data Feed Query Explorerを使う</h4>
<p><a title="http://code.google.com/apis/analytics/docs/gdata/gdataExplorer.html" href="http://code.google.com/apis/analytics/docs/gdata/gdataExplorer.html">http://code.google.com/apis/analytics/docs/gdata/gdataExplorer.html</a>に行って、</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000011.jpg"><img style="display: inline; border-width: 0px;" title="Data Feed Query Explorer で参照サイトとパスを同時に出す" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000011_thumb.jpg" border="0" alt="Data Feed Query Explorer で参照サイトとパスを同時に出す" width="527" height="484" /></a></p>
<p>上のidsの所には、通常のウェブで見てる時に、ブラウザのＵＲＬを見ると、id=xxxx とあるので、それを入れて下さい。プロファイルIDです。あとは、ブラウザをFireFoxにして、<a href="https://addons.mozilla.org/ja/firefox/addon/1852">table2clipboardというAddOn</a>を入れると、コピーしたものがエクセルにそのまま張り付きます。(* データ数が多いとブラウザが固まるかもしれません。数千件ぐらいのデータは気を付けるべきです)</p>
<p>エクセルに行くのは省きます。</p>
<h4>Google Apps Scriptを使う</h4>
<p>もちろん、他のスクリプト言語でデータを取り出してもいいです。Google Appsを使っているとGoogle Spreadsheetに apps scriptというエクセルでのVBAみたいなものがあるのですが、それだと、データを集めてspreadsheetにも出力できますし、同時にmailを送る事もできます。(Google Apps Scriptを使って、Google Analyticsのデータを出しているところ)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000012.jpg"><img style="display: inline; border-width: 0px;" title="Google Apps scriptで、google analyticsのデータを出す" src="http://abc-analytics.com/wp-content/uploads/0bbeca721437_14A6/WS000012_thumb.jpg" border="0" alt="Google Apps scriptで、google analyticsのデータを出す" width="544" height="431" /></a></p>
<p>スクリプトの中で、MailApp.sendEmail()と書けば、メールも送信できます。</p>
<p>スプレッドシートなので、この図のＢ列とＣ列を足して上げれば、参照元のＵＲＬ全体が表示され、訪問回数、直帰数、滞在時間などがでます。もちろん、コンバージョンなどもだせます。</p>
<p>と言うことで、<a href="business">Google Analyticsでデータの整理にお悩みの方は、データ整理のご相談の連絡を下さい</a>。サイト運営は素人ですが、データの集計や整理を一生懸命やります。</p>
<p><strong>カスタムレポートでもデータ出せるよ！ という方法をご存じの方があれば、コメント頂けると嬉しいです。</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/referral_data_against_date/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>アドバンスセグメントを使った上での、疑似目標到達プロセス</title>
		<link>http://abc-analytics.com/funnels_with_advanced_segment_on_google_analytics</link>
		<comments>http://abc-analytics.com/funnels_with_advanced_segment_on_google_analytics#comments</comments>
		<pubDate>Sun, 07 Mar 2010 13:01:28 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[解説]]></category>
		<category><![CDATA[アドバンスセグメント]]></category>
		<category><![CDATA[ゴール]]></category>
		<category><![CDATA[セグメント]]></category>
		<category><![CDATA[目標到達プロセス]]></category>
		<category><![CDATA[離脱]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/funnels_with_advanced_segment_on_google_analytics</guid>
		<description><![CDATA[Google Analyticsでは、通常、アドバンスセグメントを使って目標到達プロセスを見る事はできないのですが、セグメントのテストの数値を、順番に拾うことによって、セグメントされたセッションでも目標到達プロセスの数字を出せるようにしました。その方法の手順を示します。]]></description>
			<content:encoded><![CDATA[<p>先週のアクセス解析ワークショップで、考えた事を元にこのエントリーを書いてます。今回のエントリーの内容としては、<a href="http://www.roirevolution.com/blog/2009/11/funnels_on_the_fly_in_google_analytics.html">ROI revolutionの記事(funnels_on_the_fly_in_google_analytics)とほとんど同一です</a>。参考にしました。</p>
<h3>目標到達プロセスとアドバンスセグメント</h3>
<h4>目標到達プロセスで、目的達成を図示する</h4>
<p>アクセス解析の目的は、ビジネスゴールの達成ができているのかを測定することです。もちろん、サイトによってゴールの種類はさまざまです。ＰＶから始まって、直帰率、読んで欲しいコンテンツへの到達率、資料請求申し込み、商品販売、さまざまですが、解析の目的には、ゴールがついて回ります。ゴールの達成度を測るわけです。でも、その過程も評価できたら嬉しいです。Google Analyticsでは、この過程を図示する機能があります。<a href="http://wiki.abc-analytics.com/view_your_report/goals/funnel-visualization">目標到達プロセス</a>と呼ばれるものです。(プロファイルごとに設定が必要です)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/54f23cd4d4d5.jpg"><img style="display: inline; border-width: 0px;" title="目標到達プロセス" src="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/_thumb.jpg" border="0" alt="目標到達プロセス" width="246" height="220" /></a></p>
<p><span>* 数字の見方に気を付ける。途中のプロセスをすっ飛ばして、ゴールに来た奴はどうやってカウントしているかです。</span></p>
<ul>
<li>何もかもすっ飛ばしたものは、直接、横に表示される。</li>
<li>トップ(図の場合Home)に来て、途中を飛ばしてgoalしたもの。こういうものも、図の中では途中を経過しているように図示される。</li>
</ul>
<p>となってます。フォームの離脱率など順番が保証されている場合は、心配はいりませんね。</p>
<p>数字の見方に気を付ける点はあるものの、ゴールの過程が図示されます。どこでセッションが切れている（到達してる)が分かりますので、離脱の多い所の改善を考えて、リンクの位置を変えようといった話につながります。</p>
<h4>分析手段である、アドバンスセグメント</h4>
<p>こうやって、道のりの過程を考えてデータを見る方法とは別に、ユーザ属性を仮定して特定の属性の人(セッション)の行動指標を見る事もGoogle Analyticsではできます。特定のセッションのみを抽出してレポートしてくれる<a href="http://wiki.abc-analytics.com/view_your_report/advanced_segments">アドバンスセグメント</a>です。</p>
<p>検索してきたセッションはどうなんだろう？ 特定のデバイスからのセッションはどうなんだろう？ ページビューが5以上あるセッションはどうなんだろう？ Google Analyticsで使うディメンジョン・指標のほとんどについて、セッションデータの切り出しができます。</p>
<p>目標達成プロセスがサイト全体でのセッションが、ゴールまでの到達(逆にいえば離脱)を見たのに対して、アドバンスセグメントでは、特定のセッション(複数)についていろんな指標面を見る、すなわち、これら(セッション)がいったいどんなものだったのかを見るわけです。目的達成のための調査をしてくれるわけです。</p>
<h4>しかし、目標到達プロセスとアドバンスセグメントは同時に使えない</h4>
<p>同時に使いたいですよね。僕もしたいです。でも、機能として出来ません。パフォーマンス上の理由なのか、特定の指標については、アドバンスセグメントが用意されていません。<a href="http://abc-analytics.com/what_is_user_in_google_analytics">以前のエントリーで書いたユニークユーザー数</a>もそうでした。</p>
<p>でも、セグメントしたデータでの目標到達プロセスを知りたいですよね？少し面倒ですが、やってみましょう。</p>
<h3>アドバンスセグメントのテストを使った擬似的な離脱プロセス数</h3>
<p>このサイトはデータが少ないので、分かり易いデータではないのですが、このサイトの３つのページ、what_are_visits…, top, profileで、what_are_visitsがランディングになったページで、profileをゴールとし、topをプロセスとします。what_are から topへいって、profileというイメージです(実は、それは出来ないのですが、便宜上そうさせておいて下さい、出すのは疑似的な数字です)</p>
<p>では、実際のデータをみていきましょう。</p>
<h4>まずは、アドバンスセグメントでページ別セッション</h4>
<p><a href="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/6a1f040e3bf2.jpg"><img style="display: inline; border-width: 0px;" title="特定の閲覧開始ページでのページ別セッション数" src="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/_thumb_3.jpg" border="0" alt="特定の閲覧開始ページでのページ別セッション数" width="544" height="467" /></a></p>
<p>正規表現は覚えると便利です。僕も昔は、？？？でしたが、使えると便利です。Google Analyticsでは使う場面がチョコチョコ出てくるのが頑張りましょう。</p>
<p>それぞれのページがどれくらいのセッションを獲得したかが、ページ別セッションに現れます。&#8221;/&#8221;が９。&#8221;/profile&#8221;が４。ただこれは、ばらばらの数字で、ゴールの過程がどうかわかりません。ゴールに設定したprofileでは4セッションという目標を達成したのですが、トップの&#8221;/&#8221;が目標達成プロセスとして、何セッション数いたのかが不明です。</p>
<h4>アドバンスセグメントの管理画面で、テスト機能を使う。</h4>
<p>アドバンスセグメントの管理画面は、もちろん、設定をする場所なのでが、セグメントのテストを使うと、おもしろい数値が取れます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/f517f8283235.jpg"><img style="display: inline; border-width: 0px;" title="セグメントのテスト１" src="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/_thumb_4.jpg" border="0" alt="セグメントのテスト１" width="544" height="419" /></a></p>
<p>上と同じ数字です。セッション数９ですね。</p>
<p>それではその中で、ゴールであるprofileまでは、どれだけのセッションが行ったのかというと、上の図に And条件を足して、</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/WS000031.jpg"><img style="display: inline; border-width: 0px;" title="セグメントのテスト２" src="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/WS000031_thumb.jpg" border="0" alt="セグメントのテスト２" width="524" height="484" /></a></p>
<p>最終的には、セッション数１、、、です。上のセッション数９が、１になりました。最初にアドバンスセグメントで上位のコンテンツを見た時は、&#8221;/&#8221;が９セッションで、&#8221;/profile&#8221;が4セッションでしたが、両方を通過(到達)したセッションは、１となったわけです。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/3a28bbbbfbfa.jpg"><img style="display: inline; border-width: 0px;" title="疑似的目標到達プロセス" src="http://abc-analytics.com/wp-content/uploads/61738ac9d3a2_C923/_thumb_5.jpg" border="0" alt="疑似的目標到達プロセス" width="544" height="409" /></a></p>
<p>整理しますと、/what_areで、169セッションありました。で、top と profileを同時に見られたセッションは、１セッションだった。</p>
<p>実際のプロセスなどで順番が仮定できる場合は、これでセグメントしたセッションで、離脱(到達)プロセスの数字が出せます。</p>
<p>Topがプロセスで、profileをゴールという順番を仮定すると、169 → 9 → １となります。9/169=5.2%。最初に85%が離脱して、次に 1/9=11%なので、89%が離脱。</p>
<p>数字も１があったり、信頼性はないですが、フォ－ムなどのプロセスで分析できるデータをお持ちの方は、今回のような形で、<strong>セグメントされたセッションに対しての</strong>目標到達プロセスで見た離脱数を出せると思います。（プロセスの順番が想定できるものという条件になりますが)</p>
<h3>まとめ</h3>
<ul>
<li>Google Analyticsで使う事の多い、アドバンスセグメントと目標到達プロセスがどういうものかの説明をしました。</li>
<li>その後、この二つは、同時に使う事ができない事を書きました。</li>
<li>代替的手段として、アドバンスセグメントの条件を一つづつ増やす事で、疑似的(順番を仮定)に目標到達プロセス(プロセスでの離脱数)をだしました。</li>
<li>順番さえ想定できれば、絞り込み条件を一つづつ増やす事で、３つ以上のプロセスにも適用が可能です。フォームなどの離脱プロセスを、アドバンスセグメントで見たいと思った場合に有効だと思います。</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/funnels_with_advanced_segment_on_google_analytics/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ディレクトリ別到達率、セカンドページセッション数、訪問回数別セグメント</title>
		<link>http://abc-analytics.com/revise_my_analysis_followed_by_workshop_for_web_analytics1</link>
		<comments>http://abc-analytics.com/revise_my_analysis_followed_by_workshop_for_web_analytics1#comments</comments>
		<pubDate>Mon, 01 Mar 2010 16:56:35 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[分析]]></category>
		<category><![CDATA[ナビゲーション]]></category>
		<category><![CDATA[ディレクトリ別]]></category>
		<category><![CDATA[訪問回数別]]></category>
		<category><![CDATA[secondPagePath]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/%e3%83%af%e3%83%bc%e3%82%af%e3%82%b7%e3%83%a7%e3%83%83%e3%83%97%e3%81%ae%e6%84%9f%e6%83%b3</guid>
		<description><![CDATA[アクセス解析のワークショップに行ってきました(感想は最後に一言)。ワークショップで受けた刺激を元に、僕のサイトのデータでの分析をします。大きく３つ分野を考えます。Q1:特定ディレクトリの到達率、Q2:ナビゲーション、Q3:ユーザセグメントです。
Q1:特定のディレクトリへの到達率を知りたい
とりあえずの手段として、コンテンツの詳細でのページビュー数のcheck
サイト構成がディレクトリ構造になっている場合、コンテンツの詳細で、ディレクトリ単位の集計した指標が見られます。まずは、ページビューを見て、サイト全体との比率を見るのがいいと思います。

上図の例で行くと、/view_your_report/ディレクトリ配下のページは、全体のページビューの1/4くらいとcheckします。簡単便利です。
ペ－ジビュ－じゃなくて、セッション数で比較したい？ この場合、 隣のページ別セッション数を使うのは良くないです。全体の比率を見るには適していません。なぜなら、ページ別セッション数は、ページ別であり、ディレクトリ別セッション数ではないからです(ページビューの方は完全にバラバラなのでＯＫ)。それで、どうするかというと、
アドバンスセグメントの管理画面でディレクトリ別セッション数を知る
全体のセッションの中で、少なくとも特定のディレクトリを通過したセッション数が知りたいです。アドバンスセグメントで、ページをディメンジョンにして、正規表現で対象セッションを絞ります。

全体のセッション数が４０9で、/view_your_reportディレクトリのページを通過したセッション数は１２４で、全体の1/4強。先ほどのページビューの約1/4とあまり変わらないかもしれませんが、セッション数からイメージしたい人には有用というか、、、安心できます。
また、個別のディレクトリのセッション数の合計は、全体のセッション数と成らない事に注意して下さい。上図の下方の該当セッション数でセッションの重複具合をcheckしておくと良いと思います。今回の場合は、全体409, 個別のディレクトリ(124+64+50+23+19)=280, OR条件での該当セッション数265。ここから、重なり具合を想像すると良いです。
注意はいるものの、ページビュー数とセッション数、それぞれから見た特定ディレクトリの到達率が分かりました。ディレクトリ別のコンテンツ制作労力のバランスを見直す指標になると思います。
Q2:サイト全体のナビゲーションを検証したい
ナビゲーションの言葉の定義が難しいのだけど、受けと攻めの二つの立場を考えて、

受け。ユーザのニーズにアンサーする。 見たい情報が提示できたのか？
攻め。ユーザの気持ちに訴求する。 見て欲しいページ(ゴール)への導線の訴求。実際にクリックしてくれたかどうか？

１(受け)は、これ！という指標が思いつかないけど、直帰率がマクロな傾向を示すかもしれないです。または、ページビュー/ ページ別セッションの推移を見ると、ユーザー行動の変化が、マクロ的に出るかも知れません。と思って、

wiki.slash-reader.comの半年のPV/ページ別セッション数。なんにも言えない、、、。アイデア倒れかも。
２(攻め)は、secondPagePathのセッション数見てみるとおもしろそうです。secondPageは最初のクリックページなわけで、意図した訴求がクリック数に結びついているかが分かる。特に、CMSなどでのテンプレートで、全てのページに同じ誘導ボタンが配置している場合、その効果が見えると思います。
特定ページがセカンド閲覧ページとなったセッション数の推移を見る。

グラフにするほどのデータが取れなかったので、取得場面のスクリーンショットです。(Data Export APIを使う)
データはこのblogです。トップページ以外のランディングで、次にトップページに移った数。ある意味、blog全体に興味を持ってくれた人の数かもしれない。ＲＳＳ取得などよりは、弱い興味だけど、、、
あるページへの誘導数を測る時に、このセッション数を出すやり方は良い方法かなと思います。大きなデータで見てみたいですね。
ナビゲーションは、受けと攻めの両面で考える。受けの方は、直帰率や(PV/ページ別セッション数)などで、攻めは、特定のsecondPagePathと成ったセッション数を出して、効果検証という流れを考えました。
Q3:ユーザー像のセグメント
ユーザ像の分類をどうするかですが、基本は、AISMAの視点でいくと思います。強い？キーワードが出てるものは、Sまで来てる。それ以外は、訪問回数でA→Iの移り変わりを見るという感じです。AISGでしょうか。Ｇはゴールです。コンバージョンです。
検索ワードは、その検索ワード自体が、顕在的なワードか？潜在的なワードか？に分類する必要があるかもしれません。サイトを象徴するワードなどは顕在層として行動特性を分ければ良い。行動特性は、ナビゲーションを見ればいいと思います。コンバージョン率もそうですね。
問題は、検索ワードが潜在的 or なんらかのキャンペーン or 参照サイト といった流入で、Attentionやinterestの段階にいる人を推定したいのですが、、、難しいです。妥協策は、訪問回数をattention, interestの積み上がりと考える事でしょうか。カスタムレポ－トで、訪問回数別のデータを見てみた(ピボットで参照元とクロスする)。

Directの内、ある程度は、twitterクライアントからの流入だと考えた方がいいと思ってます。
興味が積み上がった上でのコンバージョンという例がないので、1回目の訪問でコンバージョンしたデータだけですが、訪問回数(=~関心の積み上がり)と、参照元(当初の関心のベクトル)で、ユーザ層を分けて、コンバージョンみたいな行動成果を見たことになりました。
また、ユーザーに限りなく細分化したカスタム変数を持ってもらう事が可能なら、ユーザ単位で見た、複数の外部サイト(広告も含みますね)の貢献が出そうです。その場合は、プライバシーポリシーとの兼ね合いになりそうです。
ユーザ像が明確になれば、行動ターゲティングの導入などに進めるかもしれません。
おまけ: コンバージョンプロセスでの離脱率
Google Analyticsで良く使う目標到達プロセスでの分析も、セミナーでやったのですが、難しいなと思いました。最終的なコンバージョン率が違えば、それで優劣はでます。ただ、改善としては、プロセスを見ながら、いいとこ取りできないか考えるわけです。統計的な処理ができれば最適化と言ってもいいのかもしれません。ただ、演繹的にはムリな気がする。仮説 ＆ テストじゃないとムリっぽいです。
ここら辺りができれば、知的好奇心は満足すると思いますが、ＰＤＣＡのActionに早く移った方が良いですね。データにこだわるなら、ヒートマップとか、違うリソースによるユーザー属性とかでしょうか、でもこれも、テストの為の情報＝仮説作成の為の情報ですね。
ワークショップ、後半はこれからなので、感想の続きがある予定です。
(*)ワークショップの感想としては、自分のパファーマンスの感想なのですが、数字の計算と会話のコンテキストスイッチは、コスト高だと理解しました。知的作業には、どんどんペア(グループ)ワークを入れるべし！と思っていたのですが、そこまで簡単ではない事が分かりました。
]]></description>
			<content:encoded><![CDATA[<p>アクセス解析のワークショップに行ってきました(感想は最後に一言)。ワークショップで受けた刺激を元に、僕のサイトのデータでの分析をします。大きく３つ分野を考えます。Q1:特定ディレクトリの到達率、Q2:ナビゲーション、Q3:ユーザセグメントです。</p>
<h3>Q1:特定のディレクトリへの到達率を知りたい</h3>
<h4>とりあえずの手段として、コンテンツの詳細でのページビュー数のcheck</h4>
<p>サイト構成がディレクトリ構造になっている場合、コンテンツの詳細で、ディレクトリ単位の集計した指標が見られます。まずは、ページビューを見て、サイト全体との比率を見るのがいいと思います。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000019.jpg"><img style="display: inline; border-width: 0px;" title="directories_in_content_drilldown_report_in_google_analytics" src="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000019_thumb.jpg" border="0" alt="directories_in_content_drilldown_report_in_google_analytics" width="544" height="471" /></a></p>
<p>上図の例で行くと、/view_your_report/ディレクトリ配下のページは、全体のページビューの1/4くらいとcheckします。簡単便利です。</p>
<p>ペ－ジビュ－じゃなくて、<strong>セッション数で比較したい？ </strong>この場合、<strong><span style="font-weight: normal;"> 隣のページ別セッション数を使うのは良くないです。全体の比率を見るには適していません。なぜなら、ページ別セッション数は、ページ別であり、ディレクトリ別セッション数ではないからです(ページビューの方は完全にバラバラなのでＯＫ)。それで、どうするかというと、</span></strong></p>
<h4>アドバンスセグメントの管理画面でディレクトリ別セッション数を知る</h4>
<p>全体のセッションの中で、少なくとも特定のディレクトリを通過したセッション数が知りたいです。アドバンスセグメントで、ページをディメンジョンにして、正規表現で対象セッションを絞ります。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000021.jpg"><img style="display: inline; border-width: 0px;" title="uniqueDirectorySessions_in_google_analytics" src="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000021_thumb.jpg" border="0" alt="uniqueDirectorySessions_in_google_analytics" width="540" height="484" /></a></p>
<p>全体のセッション数が４０9で、/view_your_reportディレクトリのページを通過したセッション数は１２４で、全体の1/4強。先ほどのページビューの約1/4とあまり変わらないかもしれませんが、セッション数からイメージしたい人には有用というか、、、安心できます。</p>
<p>また、個別のディレクトリのセッション数の合計は、全体のセッション数と成らない事に注意して下さい。上図の下方の該当セッション数でセッションの重複具合をcheckしておくと良いと思います。今回の場合は、全体409, 個別のディレクトリ(124+64+50+23+19)=280, OR条件での該当セッション数265。ここから、重なり具合を想像すると良いです。</p>
<p>注意はいるものの、<strong>ページビュー数とセッション数、それぞれから見た特定ディレクトリの到達率が分かりました。ディレクトリ別のコンテンツ制作労力のバランスを見直す指標になると思います。</strong></p>
<h3>Q2:サイト全体のナビゲーションを検証したい</h3>
<p>ナビゲーションの言葉の定義が難しいのだけど、受けと攻めの二つの立場を考えて、</p>
<ol>
<li>受け。ユーザのニーズにアンサーする。 見たい情報が提示できたのか？</li>
<li>攻め。ユーザの気持ちに訴求する。 見て欲しいページ(ゴール)への導線の訴求。実際にクリックしてくれたかどうか？</li>
</ol>
<p>１(受け)は、これ！という指標が思いつかないけど、直帰率がマクロな傾向を示すかもしれないです。または、ページビュー/ ページ別セッションの推移を見ると、ユーザー行動の変化が、マクロ的に出るかも知れません。と思って、</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000022.jpg"><img style="display: inline; border-width: 0px;" title="pageviews_divided_by_uniquePageviews" src="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000022_thumb.jpg" border="0" alt="pageviews_divided_by_uniquePageviews" width="544" height="351" /></a></p>
<p>wiki.slash-reader.comの半年のPV/ページ別セッション数。なんにも言えない、、、。アイデア倒れかも。</p>
<p>２(攻め)は、<strong>secondPagePathのセッション数見てみるとおもしろそうです</strong>。secondPageは最初のクリックページなわけで、意図した訴求がクリック数に結びついているかが分かる。特に、CMSなどでのテンプレートで、全てのページに同じ誘導ボタンが配置している場合、その効果が見えると思います。</p>
<p>特定ページがセカンド閲覧ページとなったセッション数の推移を見る。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000023.jpg"><img style="display: inline; border-width: 0px;" title="secondPagePath_in_google_analyhtics" src="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000023_thumb.jpg" border="0" alt="secondPagePath_in_google_analyhtics" width="544" height="468" /></a></p>
<p>グラフにするほどのデータが取れなかったので、取得場面のスクリーンショットです。(<a href="http://wiki.abc-analytics.com/api/data_export_apis/try_data-feed-query-explorer">Data Export APIを使う</a>)</p>
<p>データはこのblogです。トップページ以外のランディングで、次にトップページに移った数。ある意味、blog全体に興味を持ってくれた人の数かもしれない。ＲＳＳ取得などよりは、弱い興味だけど、、、</p>
<p><strong>あるページへの誘導数を測る時に、このセッション数を出すやり方は良い方法かなと思います。</strong>大きなデータで見てみたいですね。</p>
<p>ナビゲーションは、受けと攻めの両面で考える。受けの方は、直帰率や(PV/ページ別セッション数)などで、攻めは、特定のsecondPagePathと成ったセッション数を出して、効果検証という流れを考えました。</p>
<h3>Q3:ユーザー像のセグメント</h3>
<p>ユーザ像の分類をどうするかですが、基本は、AISMAの視点でいくと思います。強い？キーワードが出てるものは、Sまで来てる。それ以外は、訪問回数でA→Iの移り変わりを見るという感じです。AISGでしょうか。Ｇはゴールです。コンバージョンです。</p>
<p>検索ワードは、その検索ワード自体が、顕在的なワードか？潜在的なワードか？に分類する必要があるかもしれません。サイトを象徴するワードなどは顕在層として行動特性を分ければ良い。行動特性は、ナビゲーションを見ればいいと思います。コンバージョン率もそうですね。</p>
<p>問題は、検索ワードが潜在的 or なんらかのキャンペーン or 参照サイト といった流入で、Attentionやinterestの段階にいる人を推定したいのですが、、、難しいです。妥協策は、訪問回数をattention, interestの積み上がりと考える事でしょうか。<strong>カスタムレポ－トで、訪問回数別のデータを見てみた(ピボットで参照元とクロスする)。</strong></p>
<p><a href="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000024.jpg"><img style="display: inline; border-width: 0px;" title="sessioins_by_number_of_visits_and_referrer" src="http://abc-analytics.com/wp-content/uploads/ab07749425f0_4A3/WS000024_thumb.jpg" border="0" alt="sessioins_by_number_of_visits_and_referrer" width="544" height="442" /></a></p>
<p>Directの内、ある程度は、twitterクライアントからの流入だと考えた方がいいと思ってます。</p>
<p>興味が積み上がった上でのコンバージョンという例がないので、1回目の訪問でコンバージョンしたデータだけですが、訪問回数(=~関心の積み上がり)と、参照元(当初の関心のベクトル)で、ユーザ層を分けて、コンバージョンみたいな行動成果を見たことになりました。</p>
<p>また、ユーザーに限りなく細分化したカスタム変数を持ってもらう事が可能なら、ユーザ単位で見た、複数の外部サイト(広告も含みますね)の貢献が出そうです。その場合は、プライバシーポリシーとの兼ね合いになりそうです。</p>
<p>ユーザ像が明確になれば、行動ターゲティングの導入などに進めるかもしれません。</p>
<h3>おまけ: コンバージョンプロセスでの離脱率</h3>
<p>Google Analyticsで良く使う目標到達プロセスでの分析も、セミナーでやったのですが、難しいなと思いました。最終的なコンバージョン率が違えば、それで優劣はでます。ただ、改善としては、プロセスを見ながら、いいとこ取りできないか考えるわけです。統計的な処理ができれば最適化と言ってもいいのかもしれません。ただ、演繹的にはムリな気がする。仮説 ＆ テストじゃないとムリっぽいです。</p>
<p>ここら辺りができれば、知的好奇心は満足すると思いますが、ＰＤＣＡのActionに早く移った方が良いですね。データにこだわるなら、ヒートマップとか、違うリソースによるユーザー属性とかでしょうか、でもこれも、テストの為の情報＝仮説作成の為の情報ですね。</p>
<p>ワークショップ、後半はこれからなので、感想の続きがある予定です。</p>
<p>(*)ワークショップの感想としては、自分のパファーマンスの感想なのですが、数字の計算と会話のコンテキストスイッチは、コスト高だと理解しました。知的作業には、どんどんペア(グループ)ワークを入れるべし！と思っていたのですが、そこまで簡単ではない事が分かりました。</p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/revise_my_analysis_followed_by_workshop_for_web_analytics1/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>外部サイトへの流出を記録しておく</title>
		<link>http://abc-analytics.com/track_outbound_as_a_event_and_pageview</link>
		<comments>http://abc-analytics.com/track_outbound_as_a_event_and_pageview#comments</comments>
		<pubDate>Wed, 24 Feb 2010 18:02:04 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[実施例]]></category>
		<category><![CDATA[外部リンク]]></category>
		<category><![CDATA[ページビュー]]></category>
		<category><![CDATA[イベント]]></category>
		<category><![CDATA[計測]]></category>
		<category><![CDATA[outbound]]></category>
		<category><![CDATA[pageviews]]></category>
		<category><![CDATA[trackEvent]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/track_outbound_as_a_event_and_pageview</guid>
		<description><![CDATA[外部サイトへのリンクは、バーチャルページビューとイベントを発行しておくと、トラフィック(流入元)の記録や滞在時間など、いろいろなデータが残せます。複数のドメインを管理しているパターンで、クロスドメインやサブドメインの設定が使えない場合などにも、この外部リンクの計測は代用にならないまでも、参考になると思います。*もちろん、ドメイン関係の設定ができればその方が100倍いいです。
計測タグはこんな感じです。
&#60;a href="hoge.com" onclick='pageTracker._trackEvent("Outbound", this.href, document.location.pathname, 時間値);
pageTracker._trackEvent("/outbound/" + this.href.replace(/https?:\/\//, '');')&#62; 外部リンク&#60;/a&#62;

みたいな感じです。実際は、jQueryなどを使ったりして、一括でeventを登録するタイプが便利ですが、基本は同じです。
レポート画面でのイベントの値の確認

outbound_linkを選んで、
イベントトラックの値の所には、ページロードからの時間を入れておきました。ページ上での外部離脱までの閲覧時間がでます。

平均で15秒で外部リンクされてます。エントリーの冒頭部分のリンクなのでしょうがないです。(リンクされてない場合の閲覧時間も、きっちり分けて出せますが、省きます)
一方、利用状況を見ると、セッションで見た指標が出るので、セッション単位での滞在時間がでます。

セッション単位でみると、38分です。計測方法が普通と違うのですが、平均してそれくらいページが開かれて居たことをしめします。外部に離脱しても戻ってきているか、外部リンクが新しいタブで開かれているのかのどちらかです。(* ページビューは、偽造なので実際はこの半分くらいです)
トラフィックデータの確認
簡単には、セカンダリ－ディメンジョンで確認できます。

アドバンスセグメントで、イベントのカテゴリ－・アクションでセグメントすれば、しっかりとしたセッション分析ができます。
ページ単位での計測
イベントトラッキングではページ単位の分析はできないのですが、trackPageviewも同時に計測していた場合、そちらでページ遷移？が見られます。

途中で、httpを抜いたURLにした為、ページが分かれてますが。下のは離脱したまま還って来てないですが、上のは、スグ(平均5秒)戻ってきていますね。（と言いたいのですが、他のeventTrackの影響っぽいので、たぶん、新しいタブを開いた形の計測になってしまったようです。短くは説明できません)
 
ナビゲーションサマリーで見ると、前後が同じページ（リンクされたページ)ですね。
データがしょぼいのですが、ページ遷移データみたいなものも見られます。Google Analtyicsのページ遷移は、ランディングペ－ジ分析なので、今回のバーチャルペ－ジビュ－でのページではデータが見られないです。

と言うことで、外部へのリンクの計測に、trackEventとtrackPageviewの両方を使う事で、セッション単位の分析、ページ単位での分析の両方ができる事をみました。
最近になってやっと気づいたのですか、trackEventも使いどころがありそうな気がしてきました。
最後に、カスタムレポートで、ページビューとかユニークユーザー数を出してみました。この通り解釈していいのか不安ですが。
これで終わりです。

]]></description>
			<content:encoded><![CDATA[<p>外部サイトへのリンクは、バーチャルページビューとイベントを発行しておくと、トラフィック(流入元)の記録や滞在時間など、いろいろなデータが残せます。複数のドメインを管理しているパターンで、クロスドメインやサブドメインの設定が使えない場合などにも、この外部リンクの計測は代用にならないまでも、参考になると思います。*もちろん、ドメイン関係の設定ができればその方が100倍いいです。</p>
<p>計測タグはこんな感じです。</p>
<p><code>&lt;a href="hoge.com" onclick='pageTracker._trackEvent("Outbound", this.href, document.location.pathname, 時間値);<br />
pageTracker._trackEvent("/outbound/" + this.href.replace(/https?:\/\//, '');')&gt; 外部リンク&lt;/a&gt;<br />
</code></p>
<p>みたいな感じです。実際は、jQueryなどを使ったりして、一括でeventを登録するタイプが便利ですが、基本は同じです。</p>
<h3>レポート画面でのイベントの値の確認</h3>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/trackEvent_outbound.jpg"><img style="display: inline; border: 0px;" title="trackEvent_outbound" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/trackEvent_outbound_thumb.jpg" border="0" alt="trackEvent_outbound" width="544" height="353" /></a></p>
<p>outbound_linkを選んで、</p>
<p>イベントトラックの値の所には、ページロードからの時間を入れておきました。ページ上での外部離脱までの閲覧時間がでます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000002.jpg"><img style="display: inline; border: 0px;" title="WS000002" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000002_thumb.jpg" border="0" alt="WS000002" width="544" height="428" /></a></p>
<p>平均で15秒で外部リンクされてます。エントリーの冒頭部分のリンクなのでしょうがないです。(リンクされてない場合の閲覧時間も、きっちり分けて出せますが、省きます)</p>
<p>一方、利用状況を見ると、セッションで見た指標が出るので、セッション単位での滞在時間がでます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000004.jpg"><img style="display: inline; border: 0px;" title="WS000004" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000004_thumb.jpg" border="0" alt="WS000004" width="544" height="418" /></a></p>
<p>セッション単位でみると、38分です。計測方法が普通と違うのですが、平均してそれくらいページが開かれて居たことをしめします。外部に離脱しても戻ってきているか、外部リンクが新しいタブで開かれているのかのどちらかです。(* ページビューは、偽造なので実際はこの半分くらいです)</p>
<h3>トラフィックデータの確認</h3>
<p>簡単には、セカンダリ－ディメンジョンで確認できます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000008.jpg"><img style="display: inline; border: 0px;" title="WS000008" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000008_thumb.jpg" border="0" alt="WS000008" width="518" height="484" /></a></p>
<p>アドバンスセグメントで、イベントのカテゴリ－・アクションでセグメントすれば、しっかりとしたセッション分析ができます。</p>
<h3>ページ単位での計測</h3>
<p>イベントトラッキングではページ単位の分析はできないのですが、trackPageviewも同時に計測していた場合、そちらでページ遷移？が見られます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000005.jpg"><img style="display: inline; border: 0px;" title="WS000005" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000005_thumb.jpg" border="0" alt="WS000005" width="544" height="429" /></a></p>
<p>途中で、httpを抜いたURLにした為、ページが分かれてますが。下のは離脱したまま還って来てないですが、上のは、スグ(平均5秒)戻ってきていますね。（と言いたいのですが、他のeventTrackの影響っぽいので、たぶん、新しいタブを開いた形の計測になってしまったようです。短くは説明できません)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000007.jpg"><img style="display: inline; border: 0px;" title="WS000007" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000007_thumb.jpg" border="0" alt="WS000007" width="244" height="163" /></a> <a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000006.jpg"><img style="display: inline; border: 0px;" title="WS000006" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000006_thumb.jpg" border="0" alt="WS000006" width="244" height="161" /></a></p>
<p>ナビゲーションサマリーで見ると、前後が同じページ（リンクされたページ)ですね。</p>
<p>データがしょぼいのですが、ページ遷移データみたいなものも見られます。Google Analtyicsのページ遷移は、ランディングペ－ジ分析なので、今回のバーチャルペ－ジビュ－でのページではデータが見られないです。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000009.jpg"><img style="display: inline; border: 0px;" title="WS000009" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000009_thumb.jpg" border="0" alt="WS000009" width="244" height="162" /></a></p>
<p>と言うことで、外部へのリンクの計測に、trackEventとtrackPageviewの両方を使う事で、セッション単位の分析、ページ単位での分析の両方ができる事をみました。</p>
<p>最近になってやっと気づいたのですか、trackEventも使いどころがありそうな気がしてきました。</p>
<p>最後に、カスタムレポートで、ページビューとかユニークユーザー数を出してみました。この通り解釈していいのか不安ですが。</p>
<p>これで終わりです。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000010.jpg"><img style="display: inline; border: 0px;" title="WS000010" src="http://abc-analytics.com/wp-content/uploads/42b1111e0d8a_1193F/WS000010_thumb.jpg" border="0" alt="WS000010" width="389" height="484" /></a></p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/track_outbound_as_a_event_and_pageview/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>指標数値の補正とアドバンスセグメント</title>
		<link>http://abc-analytics.com/apply_advanced_segment_for_metrics</link>
		<comments>http://abc-analytics.com/apply_advanced_segment_for_metrics#comments</comments>
		<pubDate>Tue, 23 Feb 2010 05:20:45 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[解説]]></category>
		<category><![CDATA[advanced_segment]]></category>
		<category><![CDATA[アドバンスセグメント]]></category>
		<category><![CDATA[metrics]]></category>
		<category><![CDATA[指標]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/%e6%8c%87%e6%a8%99%e6%95%b0%e5%80%a4%e3%82%92%e8%a3%9c%e6%ad%a3%e3%81%a8%e3%82%a2%e3%83%89%e3%83%90%e3%83%b3%e3%82%b9%e3%82%bb%e3%82%b0%e3%83%a1%e3%83%b3%e3%83%88</guid>
		<description><![CDATA[平均値が出発点になる
サマリ－画面で、いろんな数値を見る時に、多くの数値は平均値が出てきます。平均値に回数を掛ければ、全体の数字が出るわけですから、データをイメージする方法としては、とても合理的です。日常生活でも、平均にするといくら、というのは頻繁に出てきます。僕らは、どれくらいの確率で起きそう？と問われたら、過去の平均を即座に計算します。 webサイトなら、コンバージョン率。どれも、成功したものを試行回数で割った数字＝平均値を議論のたたき台にしています。
それで、でてきた平均を元に、サイトには、毎日これくらいのユ－ザが来て、これくらいのペ－ジ数を見てくれると想像します。その後に、トラフィックをチェックしたり、特定ペ－ジの貢献度を分析したり、コンバージョンへの導線を見たりすると思います。
分布データが見れるモノもある
でも、平均は信用ならないので、実際のデータの散らばりぐあいが見たくなる時があります。Google Analyticsでは、個別のセッションがどういったモノかを見る場合は、リピート訪問数(*)にいくのがいいです。ここではリピートセッションに関する情報だけでなく、セッションの滞在時間分布、ページビュー分布が表示されます。あとは、前回セッションからの間隔日数、そのユーザの何回目かの訪問がでます。
*この名前の付け方はヘン（英語の方は:loyalty)だと思います。
分布データからは、中央値とか散らばりとかがわかる
分布データでは、自分の頭の中に、イメ－ジができます。これくらいのセッションが、こうなる、、と。平均値はこうだけど、実際にはこういう感じなのだな、、、とイメージを、ボンヤリながらも自分の記憶に保持する事が可能になります。
でも、言葉抜きのイメ－ジは人には伝えられない
議論したり、blogを書いたりするときには、言葉が大切です。ビジネス度が上がれば上がるほど、言葉・数字以外でなんとかする、、、とはいかなくなります。
平均値を少しはマシな数字にする
なので、なんとか、アウトプットする数字を、分布データ図からのイメージに近づけたいです。
方法としては、外れにある奴には退いてもらうわけです。アドバンスセグメントさんが、やってくれます。
指標を使ったアドバンスセグメントの絞り込み
アドバンスセグメントの利用方法としては、ディメンジョン側での絞り込み(トラフィックタイプの限定、特定ページ群でのデータに絞る)事が多いのですが、指標側でも絞り込みが可能になっています。指標数字で、外れに居る奴には退いてもらいましょう。
1. イレギュラーなセッションに退いてもらう
Google Analyticsでは、データの整理が難しいページビューを、特殊なセッションとして処理しているようです。セッション中の外部ドメイン経由の流入を、

トラフィックとしては記録
コンテンツはなしとする

こういうセッションとして扱うようです。退いてもらうには、コンテンツに関する指標(ペ－ジ別セッション数、ページビュー、閲覧開始数)がゼロで見つけます。
 
ペ－ジビュ－、滞在時間などに変化が見られます。(こんなに違うのは、僕のサイトの計測がヘンだからです。普通はほとんど変わらないかもしれません)。
２．ペ－ジビュ－の多いものに退いてもらう
autopagenizeなどで閲覧してもらう時は、実態以上にペ－ジビュ－などが増えます間違いでした。でも、とりあえず、１０ペ－ジ以上のものを外しましょう。
もちろん、１０ペ－ジ以上のものを見るのもありです。
 
若干ですが、平均ペ－ジビュ－に変化がみられました。滞在時間があまり変わらないのは、１０ページ以上のセッションが特殊という傍証かもしれません。
３．滞在時間の多いものに退いてもらう
僕のサイトはeventTrackを延々と出し続ける計測方法なので、ページが開いている限りは滞在時間がカウントされます。また、最終ページがカウント対象外になる事もないはずです。ただ、タブ型ブラウザで放置されているのも滞在時間にされているので、そういうのを除けておきます。
 
２割強のセッションが放置されるのは、多いような気がしますが、、、平均ＰＶは、異常値なので、平均ペ－ジ別セッション数を出しますと、1.21(全体), 1.25(20分以下)で、放置セッションを含む全体の方がPVは少なめと、通常の数値とは逆転します。
まとめ

平均値と分布図を見比べる必要性を書きました。
セッションに関する情報が、名前がヘンだけど、ユーザー &#62; リピート訪問数 でみるとイイと書きました。
言葉にならない分布図に代わって、平均値で議論するための前提として、外れた値を持つセッションを除外しました。
その方法として、アドバンスセグメントの指標で設定をしました。

今回の話は、アクショナブルでもないし、キーパフォ－マンスと直接関連するものでもないのですが、分析するときに、ワーキングメモリーに入る事が多い平均値には、留保を付けておく事の価値を書いたものだと思ってます。
だんだん、書くネタに行き詰まってる証拠かもしれません。(分析、解説記事まで昇華できなかった言い訳です)
]]></description>
			<content:encoded><![CDATA[<h3>平均値が出発点になる</h3>
<p>サマリ－画面で、いろんな数値を見る時に、多くの数値は平均値が出てきます。平均値に回数を掛ければ、全体の数字が出るわけですから、データをイメージする方法としては、とても合理的です。日常生活でも、平均にするといくら、というのは頻繁に出てきます。僕らは、どれくらいの確率で起きそう？と問われたら、過去の平均を即座に計算します。 webサイトなら、コンバージョン率。どれも、成功したものを試行回数で割った数字＝平均値を議論のたたき台にしています。</p>
<p>それで、でてきた平均を元に、サイトには、毎日これくらいのユ－ザが来て、これくらいのペ－ジ数を見てくれると想像します。その後に、トラフィックをチェックしたり、特定ペ－ジの貢献度を分析したり、コンバージョンへの導線を見たりすると思います。</p>
<h3>分布データが見れるモノもある</h3>
<p>でも、平均は信用ならないので、実際のデータの散らばりぐあいが見たくなる時があります。Google Analyticsでは、個別のセッションがどういったモノかを見る場合は、<a href="http://wiki.abc-analytics.com/view_your_report/visitors/visitorloyalty">リピート訪問数</a>(*)にいくのがいいです。ここではリピートセッションに関する情報だけでなく、セッションの滞在時間分布、ページビュー分布が表示されます。あとは、前回セッションからの間隔日数、そのユーザの何回目かの訪問がでます。</p>
<p>*この名前の付け方はヘン（英語の方は:loyalty)だと思います。</p>
<h3>分布データからは、中央値とか散らばりとかがわかる</h3>
<p>分布データでは、自分の頭の中に、イメ－ジができます。これくらいのセッションが、こうなる、、と。平均値はこうだけど、実際にはこういう感じなのだな、、、とイメージを、ボンヤリながらも自分の記憶に保持する事が可能になります。</p>
<p><strong>でも、言葉抜きのイメ－ジは人には伝えられない</strong></p>
<p>議論したり、blogを書いたりするときには、言葉が大切です。ビジネス度が上がれば上がるほど、言葉・数字以外でなんとかする、、、とはいかなくなります。</p>
<h3>平均値を少しはマシな数字にする</h3>
<p>なので、なんとか、アウトプットする数字を、分布データ図からのイメージに近づけたいです。</p>
<p>方法としては、外れにある奴には退いてもらうわけです。<a href="http://wiki.abc-analytics.com/view_your_report/advanced_segments">アドバンスセグメントさんが、やってくれます</a>。</p>
<h3>指標を使ったアドバンスセグメントの絞り込み</h3>
<p>アドバンスセグメントの利用方法としては、ディメンジョン側での絞り込み(トラフィックタイプの限定、特定ページ群でのデータに絞る)事が多いのですが、指標側でも絞り込みが可能になっています。指標数字で、外れに居る奴には退いてもらいましょう。</p>
<h4>1. イレギュラーなセッションに退いてもらう</h4>
<p>Google Analyticsでは、データの整理が難しいページビューを、特殊なセッションとして処理しているようです。セッション中の外部ドメイン経由の流入を、</p>
<ul>
<li>トラフィックとしては記録</li>
<li>コンテンツはなしとする</li>
</ul>
<p>こういうセッションとして扱うようです。退いてもらうには、コンテンツに関する指標(ペ－ジ別セッション数、ページビュー、閲覧開始数)がゼロで見つけます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000007.jpg"><img style="display: inline; border-width: 0px;" title="WS000007" src="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000007_thumb.jpg" border="0" alt="WS000007" width="244" height="190" /></a> <a href="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000008.jpg"><img style="display: inline; border-width: 0px;" title="WS000008" src="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000008_thumb.jpg" border="0" alt="WS000008" width="221" height="244" /></a></p>
<p>ペ－ジビュ－、滞在時間などに変化が見られます。(こんなに違うのは、僕のサイトの計測がヘンだからです。普通はほとんど変わらないかもしれません)。</p>
<h4>２．ペ－ジビュ－の多いものに退いてもらう</h4>
<p><del datetime="2010-02-24T14:52:38+00:00">autopagenizeなどで閲覧してもらう時は、実態以上にペ－ジビュ－などが増えます</del>間違いでした。でも、とりあえず、１０ペ－ジ以上のものを外しましょう。</p>
<p>もちろん、１０ペ－ジ以上のものを見るのもありです。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000010.jpg"><img style="display: inline; border-width: 0px;" title="WS000010" src="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000010_thumb.jpg" border="0" alt="WS000010" width="244" height="165" /></a> <a href="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000011.jpg"><img style="display: inline; border-width: 0px;" title="WS000011" src="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000011_thumb.jpg" border="0" alt="WS000011" width="223" height="244" /></a></p>
<p>若干ですが、平均ペ－ジビュ－に変化がみられました。滞在時間があまり変わらないのは、１０ページ以上のセッションが特殊という傍証かもしれません。</p>
<h4>３．滞在時間の多いものに退いてもらう</h4>
<p>僕のサイトは<a href="http://wiki.abc-analytics.com/view_your_report/content/content_report_event_tracking/use_cases_of_event_tracking/distribution_time_on_page">eventTrackを延々と出し続ける計測方法</a>なので、ページが開いている限りは滞在時間がカウントされます。また、最終ページがカウント対象外になる事もないはずです。ただ、タブ型ブラウザで放置されているのも滞在時間にされているので、そういうのを除けておきます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/advanced_segment_wih_time_on_site.jpg"><img style="display: inline; border-width: 0px;" title="advanced_segment_wih_time_on_site" src="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/advanced_segment_wih_time_on_site_thumb.jpg" border="0" alt="advanced_segment_wih_time_on_site" width="244" height="158" /></a> <a href="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000013.jpg"><img style="display: inline; border-width: 0px;" title="WS000013" src="http://abc-analytics.com/wp-content/uploads/8ef9f5083203_904F/WS000013_thumb.jpg" border="0" alt="WS000013" width="224" height="244" /></a></p>
<p>２割強のセッションが放置されるのは、多いような気がしますが、、、平均ＰＶは、異常値なので、平均ペ－ジ別セッション数を出しますと、1.21(全体), 1.25(20分以下)で、放置セッションを含む全体の方がPVは少なめと、通常の数値とは逆転します。</p>
<h3>まとめ</h3>
<ul>
<li>平均値と分布図を見比べる必要性を書きました。</li>
<li>セッションに関する情報が、名前がヘンだけど、ユーザー &gt; リピート訪問数 でみるとイイと書きました。</li>
<li>言葉にならない分布図に代わって、平均値で議論するための前提として、外れた値を持つセッションを除外しました。</li>
<li>その方法として、アドバンスセグメントの指標で設定をしました。</li>
</ul>
<p>今回の話は、アクショナブルでもないし、キーパフォ－マンスと直接関連するものでもないのですが、分析するときに、ワーキングメモリーに入る事が多い平均値には、留保を付けておく事の価値を書いたものだと思ってます。</p>
<p>だんだん、書くネタに行き詰まってる証拠かもしれません。(分析、解説記事まで昇華できなかった言い訳です)</p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/apply_advanced_segment_for_metrics/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ユニークユーザ数の話</title>
		<link>http://abc-analytics.com/what_is_user_in_google_analytics</link>
		<comments>http://abc-analytics.com/what_is_user_in_google_analytics#comments</comments>
		<pubDate>Sun, 14 Feb 2010 07:56:04 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[解説]]></category>
		<category><![CDATA[googleanalytics]]></category>
		<category><![CDATA[newvisits]]></category>
		<category><![CDATA[returingvisits]]></category>
		<category><![CDATA[uniqueVisitors]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/what_is_user_in_google_analytics</guid>
		<description><![CDATA[Google Analyticsでのユニークユーザー数の見方を、新規セッション数、リピートユーザー数、カスタムレポートなどを使い説明。また、ページ別、トラフィック別に見たユニークユーザ数を見る事で、アクショナブルな見方にする。]]></description>
			<content:encoded><![CDATA[<p>Google Analyticsで、何人の人がサイトに来たかを知ろうと思うと、ユーザー ＞ 概要のところで、ユニークユーザーの数字を見ます。指定した期間内での、ユーザー数が見られます。同じ人はダブルカウントしないという意味で、ユニークを使ってるんだと思います。</p>
<p>また、ユーザ ＞ ユーザーの傾向 ＞ ユニークユーザ数 でそのものの数字も見られます(ただし、アドバンスセグメントは無効)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000008.jpg"><img style="display: inline; border: 0px;" title="absolute_unique_visitors_in_google_analytics" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000008_thumb.jpg" border="0" alt="absolute_unique_visitors_in_google_analytics" width="244" height="158" /></a><a href="http://abc-analytics.com/wp-content/uploads/check_930C/unique_visitors.jpg"><img style="display: inline; border: 0px;" title="unique_visitors" src="http://abc-analytics.com/wp-content/uploads/check_930C/unique_visitors_thumb.jpg" border="0" alt="unique_visitors" width="244" height="150" /></a></p>
<p>2162人のユニークユーザ数。期間は、2009年9月から2010年2月１3日ですね。</p>
<p>これで、ユニークユーザ数の話は終わりかもしれないですが、今回は新規ユーザとリピータの違いを見たり、セッション分析とユーザー分析の違いを意識しながら、具体的なサイトのユニークユーザ数をブレイクダウンする方法を解説したいと思います。</p>
<h3>まずは、新規ユーザー数の話</h3>
<p>新規ユーザーとリピーターという項目では、新規ユーザ(初めてcookieが付与された)として閲覧された<strong>セッション数</strong>と、リピーターとして閲覧された<strong>セッション数</strong>がでます。どんなユーザーでも、最初に新規ユーザとしてのセッションを一回のみ経験するので、新規ユーザーのセッション数を積み上げると、サイトのユーザ数になります。期間を全期間にして、確認しましょう。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000010.jpg"><img style="display: inline; border-width: 0px;" title="new_visitors_visits_in_google_analytics" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000010_thumb.jpg" border="0" alt="new_visitors_visits_in_google_analytics" width="544" height="410" /></a></p>
<p>新規ユーザでのセッション数。全期間なので、冒頭の図のユニークユーザ数と一致するはず。</p>
<p>2162、2156と少し違いますけど、<strong>全期間では</strong>、新規ユーザのセッション数 = ユニークユーザ数 です。そうしましょう。</p>
<h4>期間別にみたい場合は？</h4>
<p>期間を区切って新規ユーザセッション数を見ることは、ユニークユーザ数(全期間でみた）の<strong>増加分</strong>を見る事になります。</p>
<p>ここでは、区切るというか、時系列でみてみましょう。アドバンスセグメントで、新規セッション数と全体を同時に見ます。見易いように週単位にします。(ユニークユーザ数の事は忘れてください、新規ユーザセッション数です)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000005.jpg"><img style="display: inline; border-width: 0px;" title="advanced_segment_new_visits_in_google_analytics" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000005_thumb.jpg" border="0" alt="advanced_segment_new_visits_in_google_analytics" width="544" height="265" /></a></p>
<p><strong>黄色の部分</strong>の折れ線グラフ(新規ユーザとしてのセッション数)が、新規閲覧者獲得状況を示す事になります。</p>
<p>新規ユーザとリピーターの比率などの生かし方は、できる１００ワザGoogle Analyticsなどに、目安の比率などがあります。</p>
<h4>流入別に見たい場合は？</h4>
<p>トラフィックの項目で獲得状況を見て、広告やＳＥＯ担当の人と、コンテンツ担当の人とで議論すれば、ＫＰＩの策定につながるかもしれません。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000007.jpg"><img style="display: inline; border-width: 0px;" title="WS000007" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000007_thumb.jpg" border="0" alt="WS000007" width="244" height="105" /></a> <a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000008_3.jpg"><img style="display: inline; border-width: 0px;" title="WS000008" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000008_thumb_3.jpg" border="0" alt="WS000008" width="244" height="98" /></a></p>
<p>検索エンジンや、キャンペーンでの、新規ユーザ獲得数の状況。</p>
<h4>ページ別に見る場合は？</h4>
<p>ページ別での新規ユーザ獲得状況は、閲覧開始ページにいって、ユーザの種類をセカンダリーディメンジョンにして、アドバンスフィルターで、新規ユーザに絞ります。（上と同じようにアドバンスセグメントでもＯＫですが、趣向を変えました)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000012.jpg"><img style="display: inline; border-width: 0px;" title="how_many_you_acquire_new_visitors" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000012_thumb.jpg" border="0" alt="how_many_you_acquire_new_visitors" width="244" height="202" /></a></p>
<p>これで、ページ別の新規ユーザ獲得数が出ます。個別ページに絞っての時系列表示は、カスタムレポートまでやれば、いけますが、ここでは省略します。</p>
<p>グラフでなく、数字が欲しい場合は、ユーザー ＞ ユーザーの傾向 ＞ セッション数で、アドバンスセグメントで、新規ユーザにして、データをDownLoadしましょう。（日単位、週単位、月単位で出来ます)。<strong>冒頭で見たように、ユニークユーザー数はアドバンスセグメントで切る事ができません。</strong></p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000006.jpg"><img style="display: inline; border-width: 0px;" title="WS000006" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000006_thumb.jpg" border="0" alt="WS000006" width="244" height="146" /></a></p>
<p>一方、リピートユーザのセッション数は、そのままではリピートユーザ数にはなりませんね。</p>
<p>どうしましょうか？ 実は、カスタムレポートに行くと、ユーザ数とユニークユーザ数という指標が用意されてます。</p>
<p><a href="http://analytics.blogspot.com/2009/10/google-analytics-now-more-powerful.html">2009年の10月に導入されたもので、いままでセグメントした場合には見られなかった指標です。</a></p>
<p><a href="http://www.marketmotive.com/training/tutorials/web-analytics/google-analytics-tracking-unique-visitors.html">http://www.marketmotive.com/training/tutorials/web-analytics/google-analytics-tracking-unique-visitors.html</a></p>
<p>（ここで、Avinashの簡単なuniqueVisitorsの紹介があるけど、本編は有料なので、見てません)</p>
<h3>ユーザ数？ ユニークユーザ数？</h3>
<p>カスタムレポートの二つのユーザ指標のうち、ユーザ数は意味不明です。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000013.jpg"><img style="display: inline; border-width: 0px;" title="strange_number_in_visitors_in_google_analytics" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000013_thumb.jpg" border="0" alt="strange_number_in_visitors_in_google_analytics" width="243" height="244" /></a></p>
<p>上図のように、ユーザ数は期間以外のディメンジョンに対応しない(リピートセッションだとゼロになってしまう)。かといって、期間での集計数字でユニークユーザ数との違いがわかりません。期間別のユーザ数？のみが出せるもの？ 何か知っている方がいたら、教えて下さい。</p>
<p>一方、ユニークユーザ数は、<a href="http://analytics.blogspot.com/2009/10/google-analytics-now-more-powerful.html">上の同じ公式blogのコメントの中</a>で、</p>
<blockquote><p><strong>Unique Visitor Metric: Now when you create a Custom Report, you can select Unique Visitors as a metric against any dimensions in Google Analytics. This allows marketers to see how many actual visitors (unique cookies) make up any user-defined segment.(</strong><strong>どのディメンジョンでも、ユニークユーザ数が出せる</strong>)</p></blockquote>
<p>と言ってます。</p>
<p>やっていきましょう。以後、ユニークユーザ数は、指定した期間での、指定したディメンジョンで集計したユーザ数という事で話しを進めます。</p>
<h3>ページ別に見たユニークユーザ数</h3>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000013_3.jpg"><img style="display: inline; border-width: 0px;" title="unique_visitors_in_custom_reporting" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000013_thumb_3.jpg" border="0" alt="unique_visitors_in_custom_reporting" width="544" height="420" /></a></p>
<p>直近一ヶ月を期間にして、ページ別に見たユニークユーザ数、及びその他の指標です。ページの詳細にいきましょう。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000014.jpg"><img style="display: inline; border-width: 0px;" title="WS000014" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000014_thumb.jpg" border="0" alt="WS000014" width="244" height="153" /></a></p>
<p>個別のページをクリックして、その後で、新規ユーザセッションと、リピータのセッションにわけましょう。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000015.jpg"><img style="display: inline; border-width: 0px;" title="unique_visitors_with_custom_reporting" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000015_thumb.jpg" border="0" alt="unique_visitors_with_custom_reporting" width="519" height="484" /></a></p>
<p>(二つの折れ線グラフにしたんですが、二つの線のスケール(両側の赤枠)が違うので、あまり意味ないですね、、、)</p>
<p><strong>ここで気を付けたいのは、ユニークユーザ数は、新規セッションとリピータセッションでは、そのまま分かれないという事です。</strong>新規ユーザセッションを経験して、この集計期間内に再度訪問する場合は、リピータセッションになりますので、一人の人が新規セッションでのユニークユーザと、レピータセッションでのユニークユーザにカウントされます。</p>
<p>全体では36人、新規ユーザセッションでは31人、リピータセッションでは9人（図の赤枠)を、<strong>違う形の３つのグループに括り直します</strong>。</p>
<ol>
<li>27人が、新規ユーザで来て、二回目は無かった       (31) &#8211; ((31+9) &#8211; (36))</li>
<li>4人が、  新規ユーザで来て、二回目以上があった    ((31+9) &#8211; (36))</li>
<li>5人が、  以前に来てて(このページ以外でも)、今回、一回は来た人  (9) – ((36+9) – (36))</li>
</ol>
<p>という分類にします。</p>
<p><span style="color: #ff0000;">こうすると、2の4人が、新規獲得読者(他のページでの新規かも知れない)で、短い間隔でもう一度来た人だとわかります。</span></p>
<p>閲覧開始ページをディメンジョンにした方が、ページを軸にした分析に向いてるかもしれないですね。そっちも見てみます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000021.jpg"><img style="display: inline; border-width: 0px;" title="WS000021" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000021_thumb.jpg" border="0" alt="WS000021" width="544" height="406" /></a></p>
<p>全体32人、新規27人、リピータセッション7人ですね、<strong>同じように違う形の３グループで括り直すと</strong>、</p>
<ol>
<li>25人が、新規ユーザで来て、二回目は無かった。(27) – ((27+7) – 32))</li>
<li>2人が、  新規ユーザで来て、二回目以上があった。 ((27+7) – 32))</li>
<li>5人が、以前に来てて(このページ以外でも)、今回一回以上はあった。(7) – ((27+7) – 32)</li>
</ol>
<p><span style="color: #ff0000;">ページと閲覧開始を比べると、４人(1:(27-25),2:(4-2))の新規ユーザは違うページからこのページに来て、二人(4-2)は再来訪者になったことがわかります</span>。</p>
<p>ページ(ランディングか、通しのページかの両方)で集計した、新規ユーザ(期間内再来訪なし、あり)、前の期間から再来訪者で分けて、ユーザ像をイメージしました。</p>
<h3>トラフィック別に見たユニークユーザ数</h3>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000022.jpg"><img style="display: inline; border-width: 0px;" title="WS000022" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000022_thumb.jpg" border="0" alt="WS000022" width="534" height="484" /></a></p>
<p>同じ指標で、ディメンジョンを参照元に代えました。</p>
<p>キーワードにドリルダウンしていって、setcustomvarを選びました。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000023.jpg"><img style="display: inline; border-width: 0px;" title="unique_visitors_with_a_keyword" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000023_thumb.jpg" border="0" alt="unique_visitors_with_a_keyword" width="544" height="403" /></a></p>
<p>今度は、全体のユニークユーザ数 = 新規ユーザセッションでのユーザ数 + レピータセッションでのユーザ数です。</p>
<p>&#8220;setcustomVar&#8221;で<strong>獲得した新規ユーザは、だれもリピータに転換していない</strong>という事ですね。書いた記事の内容が悪そうです。犯人を追及するために、セカンダリーディメンジョンで閲覧開始ページをみます。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/check_930C/WS000024.jpg"><img style="display: inline; border-width: 0px;" title="WS000024" src="http://abc-analytics.com/wp-content/uploads/check_930C/WS000024_thumb.jpg" border="0" alt="WS000024" width="244" height="102" /></a></p>
<p>ずいぶん、昔に書いた奴です。最近書いたsetCustomVarの記事じゃないです。ＳＥＯに問題がありそうです。昔書いた奴でなく、最近の書いたsetCustomVarに関する記事なら、、、と思うのですが、、検索流入数も下がってます。リピータの獲得にも失敗し、最近の記事も上位表示されてないという事かもしれないです。検索ボリュームは、下がってないと考えます。ＳＥＯ対策の記事は書けないので、これで閉めます。</p>
<h3>まとめ</h3>
<ol>
<li>ユニークユーザという期間で見たユーザ数の指標が有ることを確認しました。</li>
<li>新規ユーザセッションの数字は、ある期間での新規ユーザ獲得数になる事を見ました。また、全期間だと新規ユーザセッション数＝(アブソルート)ユニークユーザ数(absolute unique visitors)という事も確認しました。</li>
<li>ページ別、閲覧開始ページ別で、新規ユーザからのリピータ転換ユニークユーザ数をみました。</li>
<li>また、キーワード別でも同様の転換ユーザ数をみました。</li>
</ol>
<p>オマケ</p>
<ol>
<li>新規ユーザのリピータ転換は、アドバンスセグメントで、recencyとセッション数を元にセグメントすれば、似たような数字がでると思います。ただ、ユニークユーザ数の全体の数字から、新規セッション、リピータセッションにセグメントして、ユニークユーザ数を出すと、全体的なイメージがつかみ易いと思います。</li>
</ol>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/what_is_user_in_google_analytics/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>カスタム変数で試行錯誤した</title>
		<link>http://abc-analytics.com/%e3%82%ab%e3%82%b9%e3%82%bf%e3%83%a0%e5%a4%89%e6%95%b0%e3%81%a7%e8%a9%a6%e8%a1%8c%e9%8c%af%e8%aa%a4%e3%81%97%e3%81%9f</link>
		<comments>http://abc-analytics.com/%e3%82%ab%e3%82%b9%e3%82%bf%e3%83%a0%e5%a4%89%e6%95%b0%e3%81%a7%e8%a9%a6%e8%a1%8c%e9%8c%af%e8%aa%a4%e3%81%97%e3%81%9f#comments</comments>
		<pubDate>Tue, 02 Feb 2010 04:56:35 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[実施例]]></category>
		<category><![CDATA[カスタム変数]]></category>
		<category><![CDATA[customvariable]]></category>
		<category><![CDATA[_setCustomVar]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/%e3%82%ab%e3%82%b9%e3%82%bf%e3%83%a0%e5%a4%89%e6%95%b0%e3%81%a7%e8%a9%a6%e8%a1%8c%e9%8c%af%e8%aa%a4%e3%81%97%e3%81%9f</guid>
		<description><![CDATA[google analtyicsでのカスタム変数の使い方について。scopeが違う値でカスタム変数を上書きしたり、複数のindexを使った場合に、レポート画面にどう反映されるかを見てみました。はっきりとはわかりませんでした。また、data export apiで、dynamicにセグメントを書ける方法も紹介]]></description>
			<content:encoded><![CDATA[<p><span style="color: #ff0000;">2010/02/23 このサイトのカテゴリ名をペ－ジスコ－プに入れて見てたのですが、どうやら、ペ－ジビュ－はキチンとした数字になってるようです(閲覧開始と離脱も良さそう)。他の指標は、セッションレベルの指標なので、無視すればいいと思いました。下の話は、その辺りが分かってないまま書いたという事で、お願いします。(* ペ－ジスコ－プなのに、ペ－ジ別セッションを見てました、、、ごめんなさい。)</span></p>
<p>2010/02/02 17:25 少し修正しました。</p>
<p>Google Analtyicsにカスタム変数が導入されて数ヶ月経った。未だに？？？なので、試行錯誤してみた。</p>
<p>まず、公式の文書は、<a href="http://code.google.com/apis/analytics/docs/tracking/gaTrackingCustomVariables.html">http://code.google.com/apis/analytics/docs/tracking/gaTrackingCustomVariables.html</a></p>
<p>読んでも、よく分からない。文が英語のせいだけではないはず。なぜなら、<a href="http://www.amazon.co.jp/gp/product/4901823272/ref=nosim?ie=UTF8&amp;tag=adisciplinetr-22">日経ＢＰのGoogle Analyticsは、Google Analtyicsのhelpの英語の説明を丁寧に説明してくれてる本</a>なんだけど、それを読んでも良く分からなかったから。(*<a href="http://wiki.abc-analytics.com/third-party-tools/review_kantan_excel_log_sheet">日経BPのGA本について書いた別の記事</a>)</p>
<p>自分で試さないからだよ、と天の声に従い、試行錯誤した。</p>
<h3>疑問点</h3>
<ul>
<li>カスタム変数をレポートで見ると、指標としてはセッション数とか出る。
<ul>
<li>これとスコープの話(ページ、セッション、ユーザレベル)の話がイメージしづらい。</li>
</ul>
</li>
<li>同じindexを使うと、値が上書きされるらしい(そのセッションが、そのカスタム変数の値になるという事？）
<ul>
<li>でも、スコープが違うと、そうじゃ無い場合もある。</li>
</ul>
</li>
<li>複数のindexを同じセッションで使うと、どういう知見が得られるか？ がイメージしづらい。</li>
</ul>
<h3>解消のための行動方針</h3>
<ul>
<li>同じセッション内で、カスタム変数の値を上書きしまくる。
<ul>
<li>条件
<ul>
<li>スコープの違い</li>
<li>上書きのタイミング</li>
</ul>
</li>
</ul>
</li>
<li>同じセッション内で、複数のindexを同時に使う。</li>
</ul>
<h3>実際の設定</h3>
<ul>
<li>まず、a.html, b.html, c.htmlの３つのファイルを用意。</li>
<li>a → b → c と閲覧する</li>
<li>それぞれで、indexの1,2にカスタム変数を当てていく。</li>
</ul>
<h3>具体的な設定と結果</h3>
<p>設定部分:表の水色部分です。</p>
<p>結果: 赤の部分より下です</p>
<p>*結果について)   通常のレポート画面(+アドバンスセグメント)だと、複数のカスタム変数を合わせた上での指標数値は出せないようです。カスタムレポートなら、サブディメンジョンで複数のカスタム変数で降りて見られます。今回はData export apiで出した数値です。<br />
<a href="http://spreadsheets.google.com/pub?key=tAx7qHByxCJIARjrvyI9y3Q&amp;output=html" target="_blank">別ページで開きたい方はこちら</a></p>
<p><a href="http://spreadsheets.google.com/pub?key=tAx7qHByxCJIARjrvyI9y3Q&amp;output=html" target="_blank">別ページで開きたい方はこちら</a></p>
<p>(<a href="http://code.google.com/apis/analytics/docs/gdata/gdataExplorer.html">Data Export API Explorer</a>で出しました dynamicセグメントは便利です)</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/d25f32a5c922_B038/WS000004.jpg"><img style="display: inline; border-width: 0px;" title="WS000004" src="http://abc-analytics.com/wp-content/uploads/d25f32a5c922_B038/WS000004_thumb.jpg" border="0" alt="WS000004" width="244" height="218" /></a></p>
<h3>得られた事</h3>
<ul>
<li>ユーザレベルの上書きは、上書き前と後のセッションが、それぞれ提示されている</li>
<li>ページスコープの上書きは、セッション最後の値（ページ最後ではなく)しか記憶されない？
<ul>
<li>だとすると、ページレベルとセッションレベルが分かれている、その存在理由が分からない。</li>
<li>僕の結果の指標数値の出し方に問題があるのか？？？</li>
</ul>
</li>
<li>なぜか、ページビューが２倍になってカウントされている。(pagepathで値を見ると、a → a… cとなっているので、a,a,b,b,c,cとなっていそう)</li>
</ul>
<p>やっぱり、ページレベルの変数設定は、このままでは使えない。何かがおかしい、、、、</p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/%e3%82%ab%e3%82%b9%e3%82%bf%e3%83%a0%e5%a4%89%e6%95%b0%e3%81%a7%e8%a9%a6%e8%a1%8c%e9%8c%af%e8%aa%a4%e3%81%97%e3%81%9f/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Google AnaltyicsでのABテスト</title>
		<link>http://abc-analytics.com/ab_test_in_google_analytics</link>
		<comments>http://abc-analytics.com/ab_test_in_google_analytics#comments</comments>
		<pubDate>Tue, 26 Jan 2010 04:57:29 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[実施例]]></category>
		<category><![CDATA[abtest]]></category>
		<category><![CDATA[ANALYTICS]]></category>
		<category><![CDATA[google]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/ab_test_in_google_analytics</guid>
		<description><![CDATA[Google Analyticsのカスタム変数を使ったＡＢテストの実施例です。純粋なＡＢテストというより、Ａ，Ｂ群に分けた測定という感じです。カスタムレポートとアドバンスセグメントを使って測定対象数値を出しました。]]></description>
			<content:encoded><![CDATA[<h3 id="head_pic"><a href="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000024.jpg"><img style="display: inline; border-width: 0px;" title="google_analytics_abtest_with_custom_reporting" src="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000024_thumb.jpg" border="0" alt="google_analytics_abtest_with_custom_reporting" width="350" height="291" /></a></h3>
<p>ABテストのようなものを行ったので、メモを残します。</p>
<p>テストのようなと言う理由は、このサイトは、wordpress(CMS)で、アクセス数が少ないという条件なので、</p>
<ul>
<li>サイドバーの特定のリンクが押されたのをコンバージョンとした。</li>
<li>CMSのサイドバーなので、どんなページでも、そのリンクが出る。</li>
</ul>
<p>としたからです。同一条件とは言えないです。ランダムに振り分けた二つの群の数値、という説明が適当です。</p>
<h3>ＡＢテストを行う前に</h3>
<p>必要性を考えましょう。アドバンスセグメントで十分かも知れません。</p>
<p>また、Google Web Site Optimiserで、ＡＢテストそのものが無料で提供してます。</p>
<h3>準備</h3>
<p>ただ、必要性の検討も時間がかかるので、とりあえずやってみました。前のエントリーに書きましたが、<a href="http://www.rowtheboat.com/archives/39">http://www.rowtheboat.com/archives/39</a> (AB Testing with Google Analytics)が参考になります。Ａ，Ｂに振り分けて、カスタムレポートで見る方法です。なので、手順は、</p>
<ul>
<li>cookieに該当する値がなければ、PHPで乱数を振る。あれば、そのまま。これで、AかBを決める。（ユーザ固定方式)</li>
<li>設定した値で、sytlesheetを読み込み、Google Analyticsのカスタム変数を設定する。</li>
<li>pageTracker._trackPageview()を送る。</li>
</ul>
<p>ちなみに、AとBの違いは、リンクの色が赤いかどうかです。今作ってる、<a href="http://wiki.abc-analytics.com">Wikiへのリンク</a>をAの方は赤くしただけです。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000029.jpg"><img style="display: inline; border-width: 0px;" title="WS000029" src="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000029_thumb.jpg" border="0" alt="WS000029" width="244" height="148" /></a></p>
<p>最後に、一応コードを貼り付けます。(PHPは、hello worldくらいしか書いた事なかったので、変なコードかも)</p>
<h3>レポート画面</h3>
<p>冒頭の絵が出来上がりの図です。そこまで、至る過程としては、</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000025.jpg"><img style="display: inline; border-width: 0px;" title="WS000025" src="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000025_thumb.jpg" border="0" alt="WS000025" width="244" height="181" /></a><a href="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000026.jpg"><img style="display: inline; border-width: 0px;" title="WS000026" src="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000026_thumb.jpg" border="0" alt="WS000026" width="244" height="190" /></a></p>
<p>カスタムレポートのディメンジョンで、カスタム変数のキー &gt; 値とし、</p>
<p>アドバンスセグメントで、ゴールのURLがページとなってるものをセグメントします。</p>
<p><a href="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000028.jpg"><img style="display: inline; border-width: 0px;" title="WS000028" src="http://abc-analytics.com/wp-content/uploads/GoogleAnaltyicsAB_1506E/WS000028_thumb.jpg" border="0" alt="WS000028" width="244" height="188" /></a></p>
<p>カスタム変数のキー１には、他の名前のものが出る人もあると思います。</p>
<p>該当するABTest20100120と選ぶと、<a href="#head_pic"><strong>冒頭の図</strong></a>になります。</p>
<h3>考察</h3>
<p>こんな感じでも、それなりに良い感じだと思います。コンバージョンが３つだけですが、レポートで、数字を解釈できると思います。</p>
<p>ただ、A/Bテストは差がでるものでやるべきだと思いました。あと、コンバージョンが上がるゴールにしないと、いつまで経っても有意な数字が得られません。</p>
<p>しかし、今回の複数に振り分けた群での指標を比較は、発見があるかもしれないです。なぜなら、普段のアクセス解析では、こういう行動をしたユーザは何を考えているのだろう？ と分析します。分析した人は、それを踏まえ条件を設定し、群に振り分けるます。こういうのは、実装としては心理的抵抗感が少なく、アクショナブルかなと思います。がちがちのABテストよりも楽？な感じがします。</p>
<h3>付け足し</h3>
<p>今回、カスタム変数をいじったのですが、ページレベルのカスタム変数を、コンバージョンページに割り当てておくべきだったかもしれません。そうすれば、レポート画面でもう少し簡単に結果が見れたかもしれません。さきほど、設定してみたので、また書きたいと思います。</p>
<p>コード</p>
<div id="scid:812469c5-0cb0-4c63-8c15-c81123a09de7:ec696493-6c88-4d14-b0c0-9aa58a4e4756" class="wlWriterEditableSmartContent" style="margin: 0px; display: inline; float: none; padding: 0px;">
<pre class="php">$GLOBALS["flg"] = mt_rand(1,2);
function init(){
  function f($value,$i){
    $a = split("=", $value);
    if(count($a) &gt; 2){
      if($a[0]=="1" &amp;&amp; $a[1]=="ABTest20100120"){
        $GLOBALS["flg"] = $a[2];
        return;
      }
    }
  }

  $s = h($_COOKIE['__utmv']);
  if($s){
    $ret = split("\|",$s);
  }else{
    return;
  }
  if($ret &amp;&amp; $ret[1]){
    $ret = split(",", $ret[1]);
  }else{
    return;
  }
  if(!$ret){$ret = array('');}
//echo $GLOBALS["flg"];
  array_walk($ret, 'f');
}
init();</pre>
</div>
<p>この後に、$GLOBALSに合わせて、stylesheet読み込み、カスタム変数の設定などを行いました。</p>
<p>初心者丸出しかも知れませんが、指摘してもらえると有り難いです。</p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/ab_test_in_google_analytics/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ABテストと統計数字(A smart bearのblogから)</title>
		<link>http://abc-analytics.com/decision-on-a-abtest-from-smart-bear-blog</link>
		<comments>http://abc-analytics.com/decision-on-a-abtest-from-smart-bear-blog#comments</comments>
		<pubDate>Mon, 18 Jan 2010 04:09:16 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[解説]]></category>
		<category><![CDATA[ab]]></category>
		<category><![CDATA[テスト]]></category>
		<category><![CDATA[blog]]></category>
		<category><![CDATA[test]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/ab%e3%83%86%e3%82%b9%e3%83%88%e3%81%a8%e7%b5%b1%e8%a8%88%e6%95%b0%e5%ad%97a-smart-bear%e3%81%aeblog%e3%81%8b%e3%82%89</guid>
		<description><![CDATA[smart bearというblogの紹介。簡単にABテストでの有意差を判断できる。使うのは簡単なかけ算のみ。後ろの方で、カイ二乗値の話や、注意すべき点などについても触れます。]]></description>
			<content:encoded><![CDATA[<p>僕を含めた大部分の人は統計が苦手。だって直感じゃだめだから。そこで、英語で書かれたblogで良い記事を見つけたので、紹介します。Adwordsを題材にしています。</p>
<p><a title="http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html" href="http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html">http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html</a>（ハムスターの動画がかわいい）</p>
<p>* Google AnalyticsでＡＢテストやりたい！ という人は、Google Analyticsでのマルチカスタム変数を使ったA/Bテストの例があります。<a href="http://www.rowtheboat.com/archives/39">http://www.rowtheboat.com/archives/39</a> (AB Testing with Google Analytics)。参考として。</p>
<p>基本は、コインの裏表が出た回数が、どれくらい開けば、インチキと言っていいのかの話だと思います。ＡＢに差があると。</p>
<p>数式は、<a title="http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html" href="http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html">http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html</a>の引用で、</p>
<blockquote><p>Okay okay, we suck at math. So what&#8217;s the answer? Here&#8217;s the bit you&#8217;ve been waiting for:</p>
<p><strong><em>The way you determine whether an A/B test shows a statistically significant difference is:</em></strong></p>
<ol>
<li><strong>Define N as &#8220;the number of trials.&#8221;<br />
</strong>For Hammy this is 8+4 = <strong>12</strong>.<br />
For the AdWords example this is 32+19 = <strong>51</strong>.</li>
<li><strong>Define D as &#8220;half the difference between the &#8216;winner&#8217; and the &#8216;loser&#8217;.&#8221;<br />
</strong>For Hammy this is (8-4) ÷ 2 = <strong>2</strong>.<br />
For AdWords this is (32-19) ÷ 2 = <strong>6.5</strong>.</li>
<li><strong>The test result is statistically significant if D2 is bigger than N.</strong><br />
For Hammy, D2 is 4, which is not bigger than 12, so it is <em>not significant</em>.<br />
For AdWords, D2 is 42.25, which is not bigger than 51, so it is <em>not significant</em>.</li>
</ol>
<p><em>(For the mathematical justification, see the end of the post.)</em></p></blockquote>
<p><em>ＡとＢの回数を足したのがN。AとBの差を引いて半分にしたのがＤ。Ｄを二乗してＤ２。D2がＮより大きくなれば、晴れてイカサマ（信頼度がある）と言っていい。adwordsなら、AとBで勝負が付いた！という話になる。</em></p>
<ul>
<li><em>条件はＡとＢのimpression回数が同じ（adwordsのデフォルトは、そうでなかったかも？)</em></li>
<li><em>Ａのクリック回数がＡ，Ｂのクリック回数がＢとして、</em></li>
<li><em>Ｎは、A+B。クリック総数。Dは(A-B)/2</em></li>
<li><em>上の例だと、３２と１９という数字でも十分ではない。３４対１９までいけば十分イカサマ。</em></li>
</ul>
<p>これで、終わり。３４対１９だと、差(D)が15/2=7.5なので、7*7=49, 8*8=64で、N=53を超えそうだなあ、、という感じです。</p>
<p><strong><span style="font-size: medium;">かけ算の九九で、ＡＢテストの結果を判別する話でした。</span></strong></p>
<hr />ちなみに、この記事(<a href="http://www.fallinstar.org/2010/01/ab.html">http://www.fallinstar.org/2010/01/ab.html</a>)での数字は、350/4963, 285/4953 ですね。</p>
<p>少し強引ですが、同じ回数の試行と考えるために、350, 286 とすると、</p>
<p>D=1024  &gt; N=636 となり、</p>
<p>と晴れて有意に差があると言えます。仮に、350, 290でも、D:900 &gt; N:640で、差（カイ二乗値が４超え）はあると言えます。</p>
<p>信頼度がどれくらいかみておきましょう。<a href="http://stattrek.com/Tables/ChiSquare.aspx">http://stattrek.com/Tables/ChiSquare.aspx</a></p>
<p>ここでみると、自由度１のカイ二乗値が6.15の場合は、98-99%の有意水準になります。逆に言うと、１ー２％くらいはこういう結果になり得るみたいなので、１００回同じページでのＡＢテストをやっても、１，２回くらいこういう結果がありそう、とも言えそうです。</p>
<p>とりあえず、テストを打ち切る場合には、信頼度はこれくらいだったとメモを残しておけば良いのだと思います。何かの御札になるかもしれません。</p>
<hr />
<h3>Q&amp;A</h3>
<p>でも、その記事が良いのは、その後のバックグランンドの説明と、コメントのやりとりが教育的な事。とても良い記事です。</p>
<p><a href="http://blog.asmartbear.com/easy-statistics-for-adwords-ab-testing-and-hamsters.html">詳しくは読んで頂くとして、</a> 僕が理解したことは書いていきます。</p>
<h4>インプレッション数は関係ないの？</h4>
<p>関係ないです。クリックされなかったという事はA/Bの差に関する話には関連しません。今回は、ＡとＢが同じ確率であるはずという前提で、Ａがクリックされた数とＢがクリックされた数を比較してるだけの話です。</p>
<h4>カイ二乗値の出し方</h4>
<p>我慢して数字を飲み込みましょう。</p>
<ul>
<li>出す数字は、（実際の結果の数字 &#8211; そうであるべき数字)を二乗して、回数で割ったものです。</li>
<li>今回は、その数字をＡとＢについてやるので、AとＢで出た数字を足し上げて、試行回数で割ります。</li>
<li>それぞれの試行回数が、N/2になるのは、A/Bテストだからですね。１００回コインを投げたらN/2の５０回になって欲しいですよね。</li>
</ul>
<p>数式も引用させてもらいましょう、(nと小文字になってますが、見易いので、僕の文では大文字のＮにしてます、総試行回数と結果回数がこっちゃになりますが、気になる人にはごめんなさいです)</p>
<blockquote><p><img src="http://blog.asmartbear.com/wp-content/ss-images/chi-square-equation-subst.png" alt="" /></p></blockquote>
<p>分数の計算をして、</p>
<ul>
<li>(A*A + B*B – AN &#8211; BN + N*N/2)/(N/2) で、</li>
<li>Dは、(A-B)の差を半分にしたものだったので、2D=(A-B)で、</li>
<li>N=A+Bなので、N*N=A*A+2AB+B*Bとして、</li>
<li>ガチャガチャして、</li>
<li>4D*D/Nです。 カイ二乗の値が。</li>
</ul>
<p>それで、自由度１(A/Bの二つを比べるので１）のカイ二乗値の表を引っ張りだす or Excelを使って(冒頭の図は、Google DocsにExcelからコピーしたもの)出します。このカイ二乗値（実際の値とあるべき値の差を取って、二乗して、割った値）は、大きくなればなるほど、あるべき値から離れていて、イカサマ具合が増す数字です。３．８までいくと、95%くらいは、、、、イカサマと言っていいです。A/Bが半々とは、とても信頼できないです。</p>
<h4>以下、数字で感覚をつかみます。</h4>
<p>カイ二乗値(自由度１)が6.6までいくと、99%あり得ない。</p>
<p>3.8とか6.6とかのカイ二乗値は、上でガチャガシャやって 4D*D/Nでした。Dは、１番最初にやった、とにかく、AとBの差を取って半分にしろ！ と言って便宜的に決めた数字でしたね。D = (A-B)/2</p>
<p>４D*D/Nの計算値が、4くらいまで膨らめば（Ｄが大きくなる = 差が開く)、まあイカサマというか、あるべき数字からは外れてると考えると、４くらいまで来てる、4D*D/Nが、なので、4=4D*D/Nで、D*D = N ですね。</p>
<p>８くらいまで値が外れてる事になれば、4D*D/Nが８なので、   D*D = 2N ですね。（信頼区間の数字は限りなく100%でしょうが）</p>
<p>冒頭にやった 31対１９でいくと、D=(31-19)/2=6, N=50で、 ４でも ３６と５０，８だと 36と100で話にならないですね。</p>
<p>３５対１９でいくと、D=8,N=54で、 ４(カイ二乗の値）だと、64と54で、イカサマラインをやっと超えました。</p>
<p>というわけで、あるべき数字からのズレを計算して、分布表から、これくらいズレてれば、ＯＫという数字をみてみました。4という数字の信頼度はネットの分布表をみたら、96%でした。なので、差を取って、半分にして、二乗した値と、それぞれの回数を足したものを比較して、差を取った方が大きければ、会議で、こっちのがコンバージョンが取れるパターンといえますね。保険として、１００回に４回くらいで、同じクオリティ(コンバージョンが取れる）でも、こういう結果は出ると言っておくべきかもしれません。</p>
<p>信頼度１０％だと、カイ二乗値は2.7なので、概算で、回数の方を７掛けにして、比較しても良いかもしれません。31対19は、ちょうど2.7くらいになるので、９割方は、こっちで良い！と言える話になります。</p>
<p>ビジネスの算段は８割方ＯＫでイケの話だと、カイ二乗値は1.6くらいなので、回数を４掛けでいいです。５０回なら20ですね。30対２０なら、((30-20)/2)^2は、25なので、８割方違うとなります。29対21になると、８割でもそうだと言えないです。</p>
<p>＊あくまでも、二者択一で、お互いの結果の原因に関連が無い場合です。それでも２９対２１だと８割方と言えない、、、という話になります。普通は、お互いの結果の原因は出所が同じで、どの出所の量で結果が決まったりするので、その場合は別に考える事になります。この場合は、ユーザの偏りとかでしょうか？</p>
<p>冒頭のGoolge Docsのテーブル図は、ここらあたりをまとめたものです。</p>
<h4>Ｔ分布の話</h4>
<p>CTRの数字をT検定するのではだめなのか？という話ですが、adwords(AB)は二項分布だけど、確率小、回数大だからいけるとありますが、よくわからなくなったので、パス。だれか解説して下さい。</p>
<h4>破産、ガケからの転落のメタファー</h4>
<p>上で出した表ですが、有意ゾーンに入った瞬間にテストの打ち切りをすると、結果にバイアスがかかります。</p>
<p>メタファーとしては、崖から落ちる酔っぱらいの話がでてます。僕は、昔、相場の人だったので、破産確率の話と同じだと思いました。人の信頼みたいなのも、こういう感じでしょうか？数式は難しくて、分からないのでパスします。</p>
<p>a smart bearのblogでは、回数（コンバージョンの数）を予め決めておけ！という話になってますが、少なくとも、実際に判断に使う有意水準より、テスト期間中では、その水準を引き上げておくべきなのは確かでしょう。</p>
<h4>サンプル数の話</h4>
<p>５個以上はいる。統計的にそうらしいです。理由はわかりませんので、分かるように説明してくれる人がいたら嬉しいです。</p>
<p>テストは、現場の判断で切り上げる事は多いでしょうが、どれくらいの信頼度で、そのテストを切り上げたかをメモとして残せば、暗黙知から形式知への転換の可能性も残ると思います。</p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/decision-on-a-abtest-from-smart-bear-blog/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ユーザインサイトの話を聞いてきた。</title>
		<link>http://abc-analytics.com/attend_seminar_userinsight</link>
		<comments>http://abc-analytics.com/attend_seminar_userinsight#comments</comments>
		<pubDate>Fri, 15 Jan 2010 09:33:45 +0000</pubDate>
		<dc:creator>shirai</dc:creator>
				<category><![CDATA[seminar]]></category>
		<category><![CDATA[event]]></category>
		<category><![CDATA[mouse]]></category>

		<guid isPermaLink="false">http://abc-analytics.com/%e3%83%a6%ef%bc%8d%e3%82%b6%e3%82%a4%e3%83%b3%e3%82%b5%e3%82%a4%e3%83%88%e3%81%ae%e8%a9%b1%e3%82%92%e8%81%9e%e3%81%84%e3%81%a6%e3%81%8d%e3%81%9f%e3%80%82</guid>
		<description><![CDATA[アクセス解析イニシアティブのツール勉強会で、ユーザーインサイトの話を聞いてきた感想。また、ページ別に見た、時間経過による離脱率をgoogle analyticsで出す方法の紹介、解説。]]></description>
			<content:encoded><![CDATA[<p>アクセス解析イチシアチブのツール勉強会で、ユーザインサイトのアクセス解析ツールの話を聞いてきた。<a href="http://www.uneidou.com/blog/1359.php">他の方からのとてもまとまったレポートはこちら</a></p>
<h3>背景情報</h3>
<p>以前のベンダーツールをまとめて紹介してもらうセミナーでも聞いたんだど、今回はより細かい話が聞けるのかなという期待はあった。</p>
<p>ユーザインサイトの特徴は、<a href="http://ui.userlocal.jp/functions/">http://ui.userlocal.jp/functions/</a> に書いてある。</p>
<p>話は、画面を見ながらの機能解説という流れだった。解説した人は、ハンサムな営業担当の人と美人な開発担当の人だった。</p>
<p>導入実績は、大手の企業が多いのかな？導入数は聞けなかったような。</p>
<p>無料版の中の人は11万サイト。動く人は3万サイト。動く人の総計でのPVの伸びは勢いが付いてるらしい。導入サイト数が増えたのか、個々のサイトのPVが増えたのか、どっちもだろけど。</p>
<p>英語と中国語も提供してると。(サポートはメールといってたけど、中国語の場合は、どうしてるんだろう。書ける人がいるのか、外注してるのか）。コンサルではなく、ツールベンダーなのでいいのかも。</p>
<h3>特徴(ユーザ属性、ヒートマップ）</h3>
<h4>ユーザ属性</h4>
<p>ユーザ属性情報を自社で算出？していて、それを解析情報にくっつけて出して価値を創出してる。</p>
<p>データは、どっかから買ってるわけではないと。</p>
<p>無料の”なかの人”から集めた情報を属性情報の推計に使ってると。実際のテストで推計情報と実際の情報の差をみたら、年齢と性別で8-9割、7-8割当たっていたと。年収などは、ipを元にした会社情報から、公開されてる年収情報を当てて出しているみたい。ネット習熟度という属性もあった。はっきり言って、アクセス解析なんかより、属性算出のがおもいろいかも。でも、中見は当然ブラックボックス。導入企業には、もう少し情報があるのかなあ？ パネル調査の情報とも違うし、この事業領域には、他の会社がいるのだろうか？ 謎だ。</p>
<h4>ヒートマップ(+マウスレプレイ)</h4>
<p>海外だとclicktaleが有名なのか。</p>
<p>試しに両方とも入れてみた。（後でupdateして、絵を張る。張った。）<br />
<a href="http://friendfeed-media.com/bfe437d5b94818bdad84cc35fb0714478316f97e"></p>
<p>http://friendfeed-media.com/bfe437d5b94818bdad84cc35fb0714478316f97e</p>
<p></a>clicktaleの方は、アクセスの無いサイトに張ったので、データがたまらないけど、画面構成だけ。<br />
<a href="http://friendfeed-media.com/35d61fba8edaecc13a197f15d4acec808d3f2913">http://friendfeed-media.com/35d61fba8edaecc13a197f15d4acec808d3f2913</a></p>
<p>ここでも、ユーザ属性が効いてくる。通常のアクセス解析は、自分のところへの訪問者のデータの中からしかユーザのカテゴライズ(参入元、ページ閲覧履歴）できないけど、ユーザインサイトには推計とは言え、データがあるので、企画担当の人とかには便利そう。仮に施策が当たれば、相当なアドバンテージになりそう。実際の例はわからないけど、導入実績があるのは営業がすごいか、実際に役立つかしかない。ヒートマップとユーザ属性でクロス分析ができるので、見てても、お腹いっぱいになってくる。これを見てすぐにデザイン変更とはいかないかもしれないけど、A/Bテストの案とかは、これを見てたら浮かんできそう。</p>
<p>他には、新機能でマウスの動きを見せてくれるものや、ユーザのアクセス状況のリアルタイムでの表示や、機能追加がどんどん進んでる印象。ツール自体のOEM提供も始めるようで、元気のある感じを受けた。海外展開もしてるし、ビジネスモデルはユニークだし。中国でも、なかのひとをやって、ユーザ属性を取れたらおもいしろそう。</p>
<h3>ちょっと脱線</h3>
<p>ヒートマップは、マウスの動きから、視線の動きを推計して表示するもの。たぶん。文章なら熟読。絵なら注目。attentionを計測することになる。将来は、瞳孔の開き具合とか、脳波の発生具合までいけば、おもしろいと思った。ユーザテストとかで、やってる会社もあるのだろうか？</p>
<p>僕がアクセス解析をやってるのは、究極的には、情報が頭の中で伝達されたかどうかが知りたいわけで、マウスでもキーボードでも、なんでも測れと思うけど、ユーザインサイトは、ユーザ属性も含め、興味深い情報を集めてると思う。（キーボードの情報を集めないのか？と聞いたら、キーロガーになると一笑に付された。<a href="http://forum.clicktale.net/viewtopic.php?f=2&amp;t=448&amp;p=1370">clicktaleの方は取ってる</a>。</p>
<p>* 今年は、電子書籍の普及元年と言われているけど、サイト解析より、電子書籍の閲覧解析がしたい。電子書籍端末の値段が下がれば、教育関係からその手の端末がでてもおかしくない。まずは、閲覧解析ではなく、採点からはいるだろうけど。理解のフィードバックを機械的に得られれば、公文的なドリル学習も一世代、先に進める。また、速読関連にも役立ちそう。</p>
<p>妄想モード二、ハイッテシマッタ。</p>
<p>以上です。</p>
<h3>Google Analyticsでのマウス位置からFunnelReportもどき</h3>
<p>google analyticsでは、もちろんヒートマップなんて高機能なものはない。ただ、apiは充実してるので、頑張れば、データ自体は取れる。</p>
<p>下の図は、１０秒間隔で、ページの高さで見たマウスの位置をデータとして送っていた時のデータ。動機は、時間別にマウス位置が下まで下がっていけば、読まれてる計れるかなと思ったこと。<del datetime="2010-01-15T16:51:24+00:00">今は取ってないけど</del>(今日2010/01/16から再開した)、長いランディングページとかの設定の以来とかあれば、計画を立てて計測したいと思っている。時系列でなくて、ポイントを設置して、そのポイントをいつ通過したかみたいな、マラソンのコース取りみたいなのをイメジしてる。</p>
<p>何はともあれ、データは<a href="http://abc-analytics.com/google-analytics-apply-custom-variables">このページ</a>の１０秒事でのマウス位置。イベントアクションが経過時間数。ラベルにページurl、値にマウス位置（ぺージ内</p>
<p>割合）。１番右が平均値。いつもの事ながら母数が少ないけど。アクションの値は文字列なので、数字的な順列で並ばない。</p>
<p>マウス位置より、イベント数で見た時間別の離脱率？みたいなものの方が興味深いかもしれない。</p>
<div class="wp-caption alignnone" style="width: 521px"><a href="http://abc-analytics.com/wp-content/uploads/3c643cb79d2a_CE30/image.png"><img style="display: inline; border: 0px initial initial;" title="image" src="http://abc-analytics.com/wp-content/uploads/3c643cb79d2a_CE30/image_thumb.png" border="0" alt="image" width="511" height="772" /></a><p class="wp-caption-text">google analytics event report mouse tracking</p></div>
<p>エクセルに落として、グラフにしてみた。棒はイベント数（時間経過での離脱率）、折れ線がマウス位置。</p>
<p>ヒートマップのファネルレポートとは、比べようがないけど、時間経過、離脱、読まれた位置という３要素は入っているので、想像はできる。</p>
<div class="wp-caption alignnone" style="width: 554px"><a href="http://abc-analytics.com/wp-content/uploads/3c643cb79d2a_CE30/image_4.png"><img style="display: inline; border: 0px initial initial;" title="image" src="http://abc-analytics.com/wp-content/uploads/3c643cb79d2a_CE30/image_thumb_4.png" border="0" alt="image" width="544" height="428" /></a><p class="wp-caption-text">google analtyics event tracking time, mouseposition,visitor</p></div>
<p>突出したのは、スクロールして戻った人がいるかもしれない。</p>
<p>ヒートマップを作る人は、いろんなロジックを詰め込んでいるんだろう。</p>
]]></content:encoded>
			<wfw:commentRss>http://abc-analytics.com/attend_seminar_userinsight/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>
<!-- WP Super Cache is installed but broken. The path to wp-cache-phase1.php in wp-content/advanced-cache.php must be fixed! -->