BellCurve 統計WEB

  • Step1. 初級編
  • 2. 度数分布とヒストグラム

2-4. ローレンツ曲線

各都道府県内にある映画館のスクリーン数のデータから下のような度数分布表を作成したところ、スクリーン数の合計が0以上100未満の都道府県は全体の約80%を占めていることが分かりました。つまり、残りの20%の都道府県には100以上のスクリーンがあり、どうやら都道府県ごとのスクリーン数の分布は「偏っている」ように思えます。

階級階級値度数相対度数累積相対度数
0以上50未満25240.51060.5106
50以上100未満75140.29790.8085
合計471.0000

この「偏り=不均等さ」を表すための曲線を「ローレンツ曲線」といいます。ローレンツ曲線を作るためには2つの累積相対度数が必要です。1つ目は各階級の度数の累積相対度数です。これは2-1章で求めた、次の度数分布表の網掛け内の値になります。

階級階級値度数相対度数累積相対度数
0以上50未満25240.51060.5106
50以上100未満75140.29790.8085
100以上150未満12520.04260.8511
150以上200未満17520.04260.8936
200以上250未満22530.06380.9574
250以上300未満27510.02130.9787
300以上350未満32500.00000.9787
350以上400未満37510.02131.0000
合計471.0000

2つ目は、各階級に属する値の合計の累積相対度数です。例えば、階級「50以上100未満」のスクリーン数の累積相対度数は、以下の手順で求められます。

  1. 47都道府県すべてがもつスクリーン数の合計:3437
  2. 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の合計:646
  3. 「0以上50未満」の階級に属する24の都道府県内にあるスクリーン数の相対度数:646\div 3437=0.1880
  4. 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の合計:918
  5. 「50以上100未満」の階級に属する14の都道府県内にあるスクリーン数の相対度数:918\div 3437=0.2670

したがって、スクリーン数の合計が「50以上100未満」の階級のスクリーン数の累積相対度数は0.1880+0.2670=0.4550となります。このようにして作成した度数分布表が次の表です。

階級度数各階級の度数の
累積相対度数
各階級の
スクリーン数合計
スクリーン数の
相対度数
スクリーン数の
累積相対度数
0以上50未満240.5106(2) 646(3) 0.18800.1880
50以上100未満140.8085(4) 918(5) 0.26700.4550
100以上150未満20.85112390.06950.5246
150以上200未満20.89363770.10970.6343
200以上250未満30.95746410.18650.8208
250以上300未満10.97872580.07510.8958
300以上350未満00.978700.00000.8958
350以上400未満11.00003580.10421.0000
合計47(1) 34371.0000

この度数分布表の「各階級の度数の累積相対度数」を横軸に、「スクリーン数の累積相対度数」を縦軸にとった折れ線グラフが都道府県ごとのスクリーン数のローレンツ曲線です。グラフ中の「完全平等線」については次の2-5章で説明します。

ローレンツ曲線1

■おすすめ書籍

コア・テキスト統計学は経済学をベースに書かれている統計入門書なので、ローレンツ曲線やジニ係数、経済指標についての説明が比較的充実しています。





2. 度数分布とヒストグラム

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。