統計ソフトと集計ソフトの違い(3)
2017/08/23
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
集計ソフトの特徴が最も顕れるのは多重回答の扱いです。多重回答とは、アンケートで「この中から、あてはまるものをすべてに〇を付けてください」という質問に対する回答です。複数回答とも言います。英語ではMultiple answerですから、略してMAと言います。これに対し、「1つだけ〇を付けてください」という場合を、単回答、SA(Single answer)と言います。
集計ソフトはMAを簡単に扱えるよう、何らかの工夫がしてありますが、統計ソフトではMAという考え方そのものがないので、統計ソフトでMAを扱おうとすると、面倒な手間が必要だったり、オプションのソフトを買う必要があったりします。
例えば、次のようなMAがあったとします。
Q18.あなたがこの1年間に訪れたことがあるすべての都道府県の番号に〇を付けてください。
1.北海道
2.青森県
3.岩手県
・
・
・
46.鹿児島県
47.沖縄県
Excelや統計ソフトでこのような質問の回答をデータ入力しようとすると、北海道から沖縄県まで47個の列が必要になります。そして、北海道から順に、〇が付いている「1」を、付いていなければ「0」と、47都道府県分、入力していきます。例えば、北海道、静岡、京都、鹿児島の番号に○が付いていれば、1列目、22列目、26列目、46列目が1、残りの列が0ということになります。
10000000000000000000010001000000000000000000010
選択された都道府県の数に係わらず、1から0のキーを叩いてはEnterキーを押すという作業を47回繰り返すので、1人分の入力で94回のキータッチが発生します。
集計ソフトの1つである「秀吉」では、1個のMAに対し入力に必要な列は1列だけです。先ほどのケースであれば列には次のように入力します。
1,22,26,46
キータッチはEnterキーを含めて11回です。訪れた都道府県が30都道府県までであれば、この方式の方が、確実にキータッチが少なくなります。
データの入力方式の違いは集計にも反映されます。統計ソフトやExcelであれば、集計するために、まず47列それぞれの合計値を求めることになります。Excelにデータを入力してあればSUM関数を用いることになります。最後に各列の合計値を回答者数で割って、やっと各都道府県の出現率を知ることができます。「秀吉」なら、単純集計であろうがクロス集計であろうが、1つのMAについて1回の集計で結果がでます。
実際のアンケートでは、調査票の中に何個もMAが出てくることは珍しくありません。クロス集計も複数のパターン行うのは当たり前です。データに修正があって集計をやり直すなんて、よくあることです。1、2ページのアンケートならまだしも、数ページにわたるアンケートの結果を集計ソフトを使わずに集計しようとするなんて、時間が勿体ないとしか言いようがありません。