BellCurve 統計WEB

  • Step1. 初級編
  • 2. 度数分布とヒストグラム

2-2. ヒストグラム

ヒストグラムは度数分布表をグラフにしたものです。2-1章で使用した各都道府県内にある映画館のスクリーン数のデータを用いてヒストグラムを作成すると次のようになります。

図1

横軸は「階級」を、縦軸は「度数」を表しています。例えば、横軸が「0~50」にある棒は「スクリーン数の合計が0以上50未満の都道府県の度数」を表します。このグラフを見ると、スクリーン数の合計が0以上100未満の都道府県が大半であるということが分かります。

次に示すように、ヒストグラムの各階級の棒を度数が大きい順に左から並べ替え、その上に累積相対度数の折れ線グラフを重ねる場合もあります。このようなグラフを「パレート図」といいます。横軸は先ほどと同じ「階級」を、左側の縦軸は「度数」を、右側の縦軸は「累積相対度数」を表しています。

図2

赤い折れ線グラフを見ると、スクリーン数の合計が「0以上50未満」の都道府県は全体の約50%強であることが分かります。また、スクリーン数の合計が「0以上100未満」の都道府県は全体の約80%であることが分かります。

図3

このようにヒストグラムを描くと、データの分布を視覚的に捉えることができます。例えば次の図のように、データの分布の山(度数の多い部分)が左側に偏り、右に行くにつれて山がなだらかになっている(度数が少ない)ヒストグラムのことを「右裾が長い」もしくは「左に偏った」分布といいます。

図4

一方、次の図のようにデータの分布の山(度数の多い部分)が右側に偏り、左に行くにつれて山がなだらかになっている(度数が少ない)ヒストグラムのことを「左裾が長い」もしくは「右に偏った」分布といいます。

図5

2. 度数分布とヒストグラム

事前に読むと理解が深まる- 学習内容が難しかった方に -