統計ソフトと集計ソフトの違い(2)
2017/08/23
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
統計ソフトでも集計ソフトでもスプレッドシート状のウィンドウを開き、どの列に何のデータを入力するか決め、1ケースごとに1行に入力していくのは同じです。ほとんどソフトはExcelに入力しておいたデータをコピーして貼り付けることができます。ただし、集計ソフトでは、データ入力以外にも必要な作業があります。
秀吉では項目情報と呼んでいますが、各列が量的なデータなのか、アンケートの選択肢などカテゴリーのデータなのかを指定します。そして、量的データなら集計時にどのように階級を区切るか、カテゴリカル・データなら入力されている数値に対応するカテゴリーの名称も、処理前に設定しておく必要があります。
集計とはデータを分類して、分類ごとに該当するケースが幾つあるか数えることです。量的データを階級で区切るのもデータを分類するためです。統計ソフトの場合、思いのほか集計に苦労するのが量的データを含むクロス集計です。統計ソフトでは量的データの階級の設定ができないものもあり、そのため、データを階級に変換して別に変数を設けなければいけなかったり、集計時に面倒な操作が必要だったりします。秀吉なら任意に階級を区切ることができますし、階級を区切ってなければ、集計時にきりのよい数値で自動的に階級を設定してくれます。
量的データなら集計なんかしないで平均を求めればいいんじゃないかと考える人もいるかと思いますが、平均というのは正規分布のように、ヒストグラムを描くと平均を中心に左右均等になるようなデータでなければ、あまり意味のある数値ではありません。アンケートで得られるような量的データなら、むしろ正規分布しないものの方が多いでしょう。それから、カテゴリカル・データと量的データの関連を確認したいなら、クロス集計が一番手軽な方法なのです。
ここまで読んで、集計ソフトなんか買わずにAccessのようなデータベースを持っていれば良いのかと思った人のために、集計ソフトのもう1つ便利なところを、次回、説明します。