BellCurve 統計WEB

  • Step0. 初級編
  • 4. 代表値と箱ひげ図

4-3. 箱ひげ図を描いてみよう

今年のお祭りもそろそろ終わり。締めくくりは夜空に広がる大輪の花。猫稲荷神社の花火は、ここ福猫県内で行われる10のお祭りのうち最大の規模を誇ります。

お祭り名称総打ち上げ数
猫稲荷神社夏祭り2500
猫ヶ浜夏祭り1500
猫山祭り500
鰹節奉納祭200
桜祭り300
七夕祭450
紅葉祭150
猫杜の祇園祭1200
灯篭流し800
猫の髭港みなとまつり1000

このデータから4-2章で学んだ四分位数を求めると次のようになります。

第一四分位数300
第二四分位数650
第三四分位数1200
四分位範囲900

このデータから「箱ひげ図」を描いてみます。箱ひげ図とは、データの分布を「箱」と「ひげ」で表したグラフのことで、データの分布の様子をおおざっぱに把握することができます。

■箱を描く

まず、箱ひげ図の「箱」の部分を描きます。箱を描くためには「第一四分位数」、「第二四分位数(中央値)」、「第三四分位数」の情報を使います。

箱の下端が「第一四分位数」を、箱の上端が「第三四分位数」を、箱の中央を横切る線が「第二四分位数(中央値)」を表します。

■ひげを描く

次に、箱の上と下に「ひげ」を描きます。ひげの長さは、箱の高さ(四分位範囲)の1.5倍以下の範囲にあるデータの中で、

  • 上端は最も大きいデータまで
  • 下端は最も小さいデータまで

となります。

■外れ値を描く

最後に、ひげの範囲から外れたデータを「〇」もしくは「×」で示します。このようなデータは「外れ値」とよばれます。このデータでは、「猫稲荷神社夏祭り」の総打ち上げ数「2500」が外れ値となります。




箱ひげ図は、別のデータセットと同じグラフ上に描くことができます。このようなグラフを作成すると、それぞれのデータの分布を視覚的に比較することができます。

4. 代表値と箱ひげ図