平均値と統計法
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
マーケティング・リサーチの結果を報告していると、必ずといってよいほどクライアントから平均値が幾つか聞かれます。データの分布を1つの値だけで説明しようとするなら、平均値より中央値の方がはるかにましだと思うのですが、中央値を知りたがる人はまずいません。中央値を知らない人も結構います。中央値とは、そこから集団を二等分できる値です。中央値は中学校あたりで習うと思うのですが、中央値という言葉を授業で習ったとき以外に学校生活の中で聞いた憶えがありません。せっかく覚えても使わなければ忘れて当然かもしれませんね。
さて、マスコミの報道を見ていても、平均値に偏っていると感じます。先日もテレビを見ていたら、貧困率を「平均的な所得の半分に満たない人の割合」と説明していましたが、これは誤解を与える表現です。OECD(経済協力開発機構)の定義では「中央値の半分に満たない」です。中央値も広義の平均 average に含まれますが、この説明では、多くの人が狭義の平均 mean のことと思ってしまうのはないでしょうか。
なぜこのように平均値ばかり使うのかということについては、平均値が簡単に計算できるのに対し、中央値はデータを並べ直すという面倒な処理が必要だからということが大きいと思います。もう1つの理由としては統計法の存在が考えられます。政府が行う調査は統計法という法律に縛られています。平成19年に改正され、今年の4月1日に全面施行されるまでは政府が行った調査のローデータが開示されることはありませんでした。したがって政府発表が平均値のみであった場合、平均値が集団の中央に位置しているかどうか知る余地が無かったのです。
所得や資産などお金が絡むデータでは特にそうですが、社会現象で平均値が集団の中央に位置することは珍しいと思います。大抵は平均値の方が中央値より高くなります。まともな社会統計であれば平均値と中央値が併記されているので、見比べてみるとよいでしょう。ここ数年、統計法の改正やインターネットの普及の流れを受け、行政だけでなく、大学、団体などでも積極的にデータアーカイブを立ち上げています。ローデータの開示は、研究目的に限定されることが多いのですが、集計データについては全面開示しているところが殆どです。統計WEBにもこれらアーカイブへのリンクコーナーを設けてあります。時間があるときに覗いて見てください。