自身のウェブサイトでバナー広告を展開している場合、ページビュー数とコンバージョン数の関係や平均セッション時間と収益などの関係を気にしたことはありませんか?
このような2つの値の関係を表すために「相関関係」があります。
この「相関関係」を使うことでメイン商品Aとそれに合わせて一緒に売りたい商品Bの関係を知ることができます。
今回は日付ごとに商品Aと商品Bの数量を持つデータからその2つの相関関係を調べる方法をまとめます。
相関関係とは
寒い日におでんがよく売れる、暖かいとおでんがあまり売れないなど日常にこのようなものはたくさんあります。相関関係とはここでは気温とおでんの売り上げの関係で、気温がおでんの売り上げに強く作用してい流のがわかると思います。
また、姑が元気だと気分が乗らない、姑がいないと元気になる、といったのも相関関係があると言えます。
感覚的にわかっていたりすることもありますが、統計を使えばその相関関係は係数の元に関係の強さを判断することができます。
GAのデータで散布図を作る
相関関係を視覚的に判断するのであれば散布図を作るのが有効的です。散布図とは2つの値を持つデータ群をxとyの2軸で落とし込みできる表です。
散布図に落とし込むことでデータに何かしらの傾向が見られるのであれば、そのデータ群には相関関係が存在します。
今回はGoogleアナリティクス(GA)のカスタムレポートを使って、販売された商品Aと商品Bの相関関係を見て見ます。
GAのカスタムレポートを作る
GAのカスタムレポートを使って商品Aと商品Bの日付ごとの数量を出します。
1・左の「カスタム」から「カスタムレポート」を選択します。
2・「+新しいカスタムレポート」をクリックします。
3・タイトルに「商品Aの数量レポート」といった適当な名前を入れる。種類で「フラットテーブル」を選択します。
4・「+ディメンションを追加」をクリックし「日付」「商品」の2つを設定します。
5・「+指標を追加」をクリックし「数量」を設定します。
6・フィルタで「商品」を選択し、「完全一致」で「商品A」の名前を正確に入れます。
ここではORを使って商品Aと商品Bのどちらかを含む、というフィルタ設定ができないのでそれぞれの商品でフィルタを変更する必要があります。
7・「保存」を押せばカスタムレポートが作成されます。
8・カスタムレポート一覧から先ほど作ったレポートの「操作」からコピーを選択します。
9・コピーが作成されるのでタイトルを「商品Bの数量レポート」といった名前に変更します。
10・フィルタで「商品」を選択し、「完全一致」で「商品B」の名前を正確に入れます。
これで商品の数量のみのレポートができたので期間を設定してダウンロードすればOKです。
ちなみにこの情報であればカスタムレポートをわざわざ作る必要もありません。
コンバージョン>eコマース>商品の販売実績でセカンダリディメンションに「日付」を設定すれば同じようなデータを得ることは可能です。ただしこの場合は今回不要なデータも多く含まれます。
またASPから簡単にデータが取れるようであればGAを使う必要はありません。
商品Aと商品Bの散布図を作る
散布図作成にはグラフが作成できるソフトを使います。横軸が商品Aの数量で縦軸が商品Bの数量になるようにしましょう。
1・商品Aと商品Bの数量が日付ごとに確認できるようデータをコピペして一つのシートに統合します。
2・表計算ソフトを使って散布図を作ります。
Excelであればデータの範囲を選択して[挿入]タブから[グラフ]メニューの[散布図またはバブルチャートの挿入]を選択し、[散布図(平滑線)]を選択します。
相関関係を読み解く
散布図を作ると点に偏りがある場合、その傾向が見えてきます。相関関係には「正の相関」「負の相関」「無相関」の3つに分かれます。相関関係を理解するにはこの3パターンがどのようなものかを知っておく必要があります。
正の相関
散布図の点が右上がりに散らばっている場合「正の相関」となります。これは横軸が右に進むほど縦軸が上に進む関係にあります。
例えば商品Aの数量が増えるごとに商品Bの数量が増える場合はこの関係にあります。
この関係にあり商品の場合は、セットにして販売したり、買い漏らし時のアップセル提案などに向いている関係と言えます。
負の相関
散布図の点が右下がりに散らばっている場合「負の相関」となります。これは横軸が右に進むほど縦軸が下に進む関係にあります。
例えば商品Aの数量が増えるごとに商品Bの数量が減る場合はこの関係にあります。商品Aと商品Bがトレードオフの関係にある場合このような関係になります。
商品同士が「負の相関」の場合はバンドルだったり、アップセルの提案には不向きと言えるでしょう。
無相関
散布図の点が散らばっており、「正の相関」や「負の相関」の場合は「無相関」となります。この場合は横軸と縦軸に関係性は見られません。
例えば商品Aと商品Bが「無相関」の場合はどちらも影響がありません。バンドルにしても、アップセルで提案してもあまり響かないことが考えられます。
相関係数で相関の強さをみる
相関図から「正の相関」や「負の相関」がわかると思います。そしてその相関の強さを表すものを「相関係数」と言います。
「xとyの共分散」を「xの標準偏差とyの標準偏差の積」で割ったものが「相関係数(r)」となります。
ちなみに「xとyの共分散」とは・・・xの偏差とyの偏差の積の和を個数nで割ったもの、です。
相関係数(r) = {(x-xの平均値)×(y-yの平均値)の総和÷個数n}÷{(xの標準偏差)×(yの標準偏差)}
この相関係数rは以下の特徴があります。
・rは −1 ≦ r ≦ 1 の範囲である。
・rは 絶対値|r|の値が大きい方が相関関係が強い。0に近いと相関関係は弱い。
・rは 0に近くても何かしらの相関がある場合がある。
(散布図が2次関数で表されるような分布の場合は相関係数は低い場合があります。)
相関係数の値 | 相関係数の強弱 |
0.7~1 | 強い正の相関あり |
0.4~0.7 | 正の相関あり |
0.2~0.4 | 弱い正の相関あり |
-0.2~0.2 | ほぼ関係ない |
-0.4~-0.2 | 弱い負の相関あり |
-0.7~-0.4 | 負の相関あり |
-1~-0.7 | 強い負の相関あり |
ちなみにExcelの「データ分析」アドインから「相関」機能を使い、簡単に「相関係数」を出すことはできます。この場合、共分散がなんなのか、などは理解しなくても相関係数にたどり着くことができます。
商品間の相関関係がわかるということはユーザーのニーズを把握することができます。正の相関関係が高い商品群であれば、バンドルにしたりアップセルの提案、新商品の組み合わせなどに活かすことができるでしょう。
負の相関関係が高いのであれば、売りたい主力商品と並べると逆効果になるでしょう。その場合はトレードオフの関係なのでターゲットを変えてキャンペーンを打つなどすればいいかもしれません。
今回のデータはあくまでも2つの商品の数量をもつ日付から見た相関関係になります。もし、正確な相関関係を見るのであれば購入したユーザーごとの商品の組み合わせを見る必要があるでしょう。
ただ、日付ごとでも商品ごとの相関関係を知ることはユーザーの求める商品構成を把握するのに十分役立つのではないでしょうか。
Leave a Reply