BellCurve 統計WEB

  • Step1. 基礎編
  • 2. 度数分布とヒストグラム

2-5. ジニ係数

2つの累積相対度数を用いて描かれたローレンツ曲線を使うと、「偏り=不均等さ」を確認できます。

例えば、次の各都道府県内にある映画館のスクリーン数のデータから作成したローレンツ曲線の赤い矢印をたどると、約80%の都道府県内で全国のすべてのスクリーン数の40%強があるということが分かります。逆に、残りの約20%の都道府県内には60%弱ものスクリーン数があるということなので、スクリーンの分布は不均等であることが分かります。

ジニ係数1

この「偏り」や「不均等さ」を数値で表したものが「ジニ係数」です。ジニ係数は完全平等線((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(次の図の橙色部分)を2倍した値になります。ジニ係数は0から1までの値をとり、1に近いほど偏りが大きく、0に近いほど偏りが小さいことを表します。

ジニ係数2

■ジニ係数が0の場合

不均等さが全くない場合、ローレンツ曲線は次の図のように完全平等線と一致するためジニ係数は「0」となります。ジニ係数が0というのは、ここでは各都道府県内にあるスクリーン数が全て同じ場合、すなわち「20%の都道府県内に全国の総スクリーン数の20%があり、40%の都道府県内に全国の総スクリーン数の40%があり…」という状態を指します。

ジニ係数3

■ジニ係数が1に限りなく近づく場合

一方、例えば東京都(1/47=2.1%)に日本の全ての映画館(スクリーン)があり、他の道府県(46/47=97.9%)に映画館(スクリーン)が全くない場合、ローレンツ曲線は次のようになります。このときジニ係数は「0.979」となります。

ジニ係数2

■ジニ係数が1になる場合

例えば日本に映画館を管理する会社が1社しかなく、その会社(100%)が日本のすべての映画館(100%)を管理している場合、ローレンツ曲線は次のようになります。このときジニ係数は最大値の「1」となります。

ジニ係数3

【コラム】ローレンツ曲線は下側凸か上側凸か

ローレンツ曲線を描くとき、一般的に階級を小さい順(昇順)に並べた場合の2つの累積相対度数を用います。そのため、よく目にするローレンツ曲線は完全平等線に対して下側に凸となっています。

一方、スクリーン数の集中度を見たい場合には、下の表のように階級を大きい順に並べたものを用いることがあります。

階級度数各階級の度数の
累積相対度数
各階級の
スクリーン数合計
スクリーン数の
相対度数
スクリーン数の
累積相対度数
350以上400未満10.02133580.10420.1042
300以上350未満00.021300.00000.1042
250以上300未満10.04262580.07510.1793
200以上250未満30.10646410.18650.3658
150以上200未満20.14903770.10970.4755
100以上150未満20.19162390.06950.5450
50以上100未満140.48959180.26700.8120
0以上50未満241.0000 6460.18801.0000
合計4734371.0000

この場合のローレンツ曲線は、次に示すように完全平等線に対して上側に凸となります。このローレンツ曲線を見ると、約20%の都道府県内に60%弱ものスクリーン数があることが読み取れます。

ジニ係数5

■おすすめ書籍

コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。

created by Rinker
¥2,365 (2024/12/26 21:07:44時点 Amazon調べ-詳細)

2. 度数分布とヒストグラム

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)