バーに入ってきたビル・ゲイツ
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
平均値が集団の平均的姿を表さない典型例に平均年収があります。これを分かりやすくした話が「バーに入ってきたビル・ゲイツ」です。
「バーに入ってきたビル・ゲイツ」とは、「とあるバーにビル・ゲイツが入ってきたらバーの客の平均年収は急激に上がるけれど、ビル・ゲイツが入ってくる前からいた客が以前よりも金持ちになったわけではない」というものです。このたとえ話は、2008年、ノーベル経済学賞を受賞したポール・クルーグマンの著書、『格差はつくられた―保守派がアメリカを支配し続けるための呆れた戦略』の中でも使われていましたから、ご存知の方もいらっしゃるのではないでしょうか。
さて、総務省による2008年10-12月期の家計調査では、年間の世帯収入の平均値が544万円でした。このときの、収入の多い少ないで世帯を5等分した各階級の平均年収は次の通りです。
年間収入五分位階級 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|
平均世帯年収(万円) | 180 | 329 | 460 | 645 | 1,103 |
表を見ると第3階級の平均が 460万円、第4階級は 645万円。全体平均の 544万円はこの中間ですから、第3階級までの 60%ぐらいの世帯は平均年収以下と思われます。上位 20%である第5階級の平均年収は 1,103万円と跳ね上がっています。この階級には年収が億単位の世帯もあるでしょうから、そういう世帯が全体の平均も引き上げているのでしょう。
平均値が集団の平均像であるかどうかは、平均値と中央値を比べます。中央値とは集団を上下半々に分ける値です。上述の家計調査であれば第3階級の平均 460万円が中央値に近いはずです。平均値と中央値がほぼ一致すれば平均値は集団の特性値である可能性が高くなります。平均値が中央値よりも大きければ、上述の年収のように分布が左に偏っている可能性が高くなります。
平均値が中央値と異なる場合、平均値にはどのような意味があるでしょうか。たとえば上述の家計調査による平均年収であれば、これに日本の総世帯数を掛けることで日本の世帯年収の総額が分かります。一方、中央値に総世帯数を掛けても世帯年収の総額は分かりません。したがって、中央値よりも平均値の方が日本全体の姿を現していることになります。平均値と中央値の両方の数字があれば、国内格差の有無を読み取ることもできます。
エクセル統計ではローレンツ曲線を作成し、同時にジニ係数を求める機能が搭載されています。ローレンツ曲線は収入の不平等度など、格差の状態を表すために用いられます。