- Step0. 初級編
- 4. 代表値と箱ひげ図
4-3. 箱ひげ図を描いてみよう
今年のお祭りもそろそろ終わり。締めくくりは夜空に広がる大輪の花。猫稲荷神社の花火は、ここ福猫県内で行われる10のお祭りのうち最大の規模を誇ります。
お祭り名称 | 総打ち上げ数 |
---|---|
猫稲荷神社夏祭り | 2800 |
猫ヶ浜夏祭り | 1500 |
猫山祭り | 500 |
鰹節奉納祭 | 200 |
桜祭り | 300 |
七夕祭 | 450 |
紅葉祭 | 150 |
猫杜の祇園祭 | 1200 |
灯篭流し | 800 |
猫の髭港みなとまつり | 1000 |
このデータから4-2章で学んだ四分位数を求めると次のようになります。
第一四分位数 | 300 |
---|---|
第二四分位数 | 650 |
第三四分位数 | 1200 |
四分位範囲 | 900 |
このデータから「箱ひげ図」を描いてみます。箱ひげ図とは、データの分布を「箱」と「ひげ」で表したグラフのことで、データの分布の様子をおおざっぱに把握することができます。
■箱を描く
まず、箱ひげ図の「箱」の部分を描きます。箱を描くためには「第一四分位数」、「第二四分位数(中央値)」、「第三四分位数」の情報を使います。
箱の下端が「第一四分位数」を、箱の上端が「第三四分位数」を、箱の中央を横切る線が「第二四分位数(中央値)」を表します。
■ひげを描く
次に、箱の上と下に「ひげ」を描きます。ひげの長さは、箱の高さ(四分位範囲)の1.5倍以下の範囲にあるデータの中で、
- 上端は最も大きいデータまで
- 下端は最も小さいデータまで
となります。
■外れ値を描く
最後に、ひげの範囲から外れたデータを「〇」もしくは「×」で示します。このようなデータは「外れ値」とよばれます。このデータでは、「猫稲荷神社夏祭り」の総打ち上げ数「2800」が外れ値となります。
箱ひげ図は、別のデータセットと同じグラフ上に描くことができます。このようなグラフを作成すると、それぞれのデータの分布を視覚的に比較することができます。