BellCurve 統計WEB

  • Step1. 初級編
  • 2. 度数分布とヒストグラム

2-6. ジニ係数の求め方

次の図のローレンツ曲線から「ジニ係数」を求めてみます。ジニ係数は完全平等線((0,0)と(1,1)を結ぶ線:図中の黒破線)とローレンツ曲線との間の面積(橙色部分)を2倍した値です。

ジニ係数の求め方1

このローレンツ曲線は次の表のデータから作成しています。

累積相対度数(横軸)累積相対度数(縦軸)
00
0.40.2
0.80.6
11

まず、完全平等線とx軸(横軸)とで囲まれた部分の面積(次の図のピンク色部分)を求めます。底辺が「1」、高さが「1」の三角形なので、1\times 1\times 0.5=0.5となります。

ジニ係数の求め方2

次に、ローレンツ曲線とx軸(横軸)とで囲まれた部分の面積を求めます。この面積は、3つに分割して考えます。

ジニ係数の求め方3

①:底辺が「0.4」、高さが「0.2」の三角形なので、0.4\times0.2\times0.5=0.04となります。

②:90度回転させて考えます。上底が「0.2」、下底が「0.6」、高さが「0.8-0.4=0.4」の台形なので、(0.2+0.6)\times0.4\times0.5=0.16となります。

s1

③:同様に、下のように90度回転させて考えます。上底が「0.6」、下底が「1」、高さが「1-0.8=0.2」の台形なので、(0.6+1)\times0.2\times0.5=0.16となります。

ジニ係数の求め方4

①②③を全て足すと0.04+0.16+0.16=0.36となります。 ピンク色の面積0.5からこれら①②③の面積を引いた0.5-0.36=0.14が、橙色の部分の面積になります。したがって、0.14を2倍にした0.14\times2=0.28がジニ係数となります。

同様にして次の図の都道府県ごとのスクリーン数のデータを元に2‐4章で作成したローレンツ曲線からジニ係数を求めると「0.466」になります。

ジニ係数の求め方5

2. 度数分布とヒストグラム

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。