エクセル統計によるコンジョイント分析

2018/12/20

カテゴリ：エクセル統計

タグ：アンケート, 重回帰分析, コンジョイント分析

「エクセル統計でコンジョイント分析はできますか？」というお問い合わせをいただくことがあります。

残念ながら、2018年現在、エクセル統計には「コンジョイント分析」というメニューはありません。しかし、最もベーシックな方法で行うコンジョイント分析は、エクセル統計の機能を組み合わせることで実行できます。

以下では、エクセル統計でコンジョイント分析を行う方法を解説します。

1. 「直交配列表の作成」によるプロファイル作成

ある食品について、次のような属性と水準の商品の組み合わせを考え、被験者に回答してもらいます。回答結果から、それぞれの水準がどのような効用をもつかを調べます。

まず、プロファイルを作成します。この表のラベル行を選択し、メニューより［エクセル統計］→［分散分析・多重比較］→［直交配列表の作成］を選択します。

ダイアログが表示されたら、［OK］をクリックすると直交配列表が出力されます。

この出力の各行が、一つずつのプロファイルになります。例えば、1番目の製品は「辛く、透明」な属性を持っています。このようにして作成したプロファイルを、被験者に提示して点数を付けてもらいます。

2. 「数量化1類」による効用値の算出

先ほど作成した6パターンのプロファイルについて、3名の被験者に10点満点で点数を付けてもらいました。数量化1塁で分析するために3名の評価を縦に積み上げています。

このデータから、属性ごとの効用値を数量化1類により計算します。ラベル行をドラッグして選択し、メニューより［エクセル統計］→［多変量解析］→［数量化1類］を選択します。

ダイアログが表示されたら、［OK］をクリックし分析を実行します。出力結果の「カテゴリースコア」が、求める効用値です。

味の中では「甘い＞普通＞辛い」の順に効用が高く、色の中では「透明＞にごり」の順に効用が高いことがわかります。甘く、透明な製品を作れば、人気が高くなるかもしれません。

補足1. Rパッケージ「conjoint」との比較

統計解析ソフトRでは、「conjoint」というパッケージでコンジョイント分析を行うことができます。このパッケージ内の「tea」というデータは、次の属性と水準を持った13のプロファイルを100人に採点してもらった結果となっています。

Rでコンジョイント分析を行った結果は次の通りです。

この「tea」というデータを、先ほどのようにエクセル統計の数量化1類で分析し、結果を比較してみましょう。データをエクセル統計で分析できる状態に整形すると次のようになります。

これを数量化1類で分析した結果の効用値（カテゴリースコア）は次のようになります。

Rの結果と比較すると、結果が一致していません。これは、Rではダミー変数化した重回帰分析で計算しており、それが数量化1類の計算とは異なるためです。

ここで、数量化による結果とRによる結果を属性ごとに比較してみます。各属性の効用値のグラフは次の通りです。

よく見ると、エクセル統計の結果は、Rの結果に対して一定の数値でずれています。例えば「price」の場合、エクセル統計の結果はRの結果よりもどの水準も約 0.0369 大きくなっています。これは偶然ではなく、両手法の性質の違いによるものです。

補足2.　「ダミー変数への変換」によるダミー変数化

では、エクセル統計の重回帰分析でRと同じ結果を求める方法について解説します。

まず、元のデータの属性をダミー変数化します。「price」から「aroma」までのラベル行をドラッグして選択し、メニューより［エクセル統計］→［ユーティリティ］→［ダミー変数への変換］を選択します。

ダイアログが表示されたら、［最後のカテゴリーをダミー変数化しない］のチェックをオフにして、［OK］を選択して実行します。

ダミー変数化した結果が出力されました。

次に、ダミー変数化したデータを変形します。以下の手順で、ダミー変数化しなかったカテゴリーに該当する行の「0」を「-1」に置き換えます。

まず、ラベル行を選択し、［データ］タブ→［フィルター］をクリックします。

「price」の水準の中で名前順で最後に位置している「price:medium」のセルをクリックし、「昇順」を選択してソートします。

画面をスクロールして「price:medium」の値が「1」の行を表示します。

「price:medium」の値が「1」の行について、その行の同じ属性内の他のすべての水準で「0」を「-1」に書き換えます。この場合は、「price:high」と「price:low」の列の「0」を「-1」に書き換えます。わかりやすくするため、書き換えた部分を赤字にしています。

オートフィルなどを用いて、他の行も書き換えます。書き換えが終わると、次のようになります。

対象のすべての行で「price:high」と「price:low」の「0」を「-1」にする

この手順を、「variety」、「kind」、「aroma」の変数に対しても行います。

書き換えが終わったら、「No.」で昇順にソートし、フィルターを解除します。ここまで行うと、データは次のようになります。

次に、評価値「Y」をコピーして貼り付けます。このデータでは、一番左の列に挿入しています。

以上でダミー変数の変換は終了です。

補足3. 「重回帰分析」による効用値の算出

重回帰分析で効用値を計算しましょう。「Y」のラベルをクリックし、［Ctrl］キーを押したまま「price:high」から「aroma:yes」までの全てのダミー変数のラベル行ををドラッグして選択し、メニューより［エクセル統計］→［多変量解析］→［重回帰分析］を選択します。

ダイアログが表示されたら、「説明変数」のリストから「price:medium」、「variety:red」、「kind:leafy」、「aroma:yes」の変数を説明変数から除きます。各属性の最後のカテゴリーのダミー変数を分析に用いないということです。

「OK」をクリックし、分析を実行します。

効用値は偏回帰係数として推定されます。「回帰式に含まれる変数（偏回帰係数・信頼区間等）」の結果に出力されます。

この出力結果には、「price:medium」、「variety:red」、「kind:leafy」、「aroma:yes」の偏回帰係数（＝効用値）がありません。しかし、先ほど行ったダミー変数化の作業により、「属性内の水準の効用の総和が0である」と言えます。つまり、属性内で他の水準の効用値がわかれば、残りの1つの水準の効用値も求めることができます。

例えば、「price」について言えば、、「price:medium」＝－（「price:high」＋「price:low」）となります。それでは、「price:medium」、「variety:red」、「kind:leafy」、「aroma:yes」の効用値を求めましょう。

まず、「variety:black」、「kind:bags」、「aroma:no」、「定数項」の上に空白行を挿入し、それぞれ「price:medium」、「variety:red」、「kind:leafy」、「aroma:yes」と入力します。

次に、「price:medium」の右のセルに「=-SUM(B75:B76)」と入力します。この値が、「price:medium」の効用値となります。

同様に、「variety:red」の右のセルに「=-SUM(B78:B79)」、「kind:leafy」の右のセルに「=-SUM(B81:B82)」、「aroma:yes」の右のセルに「=-SUM(B84)」と入力します。これで、すべての水準の効用値を求めることができました。

実際に結果が一致していることを確かめてみましょう。見やすくするため、順番を並べ替えています。

エクセル統計での結果

Rでの結果

水準	効用値
low	0.2402
medium	-0.1431
high	-0.0971
black	0.6149
green	0.0349
red	-0.6498
bags	0.1369
granulated	-0.8898
leafy	7529
yes	0.4108
no	-0.4108

このようにして、エクセル統計でもコンジョイント分析ができました。

ブログ