- Step0. 初級編
- 4. 代表値と箱ひげ図
4-2. 四分位数を見てみよう
日が落ちて境内のメインステージではカラオケ大会が始まりました。赤い提灯がステージ上の猫たちを一層盛り上げているようです。
■四分位数
次の表はカラオケ大会のプログラムです。今年のカラオケ大会には全部で11匹のエントリーがありました。このプログラムの楽曲の時間から四分位数を求めてみます。
順番 | 曲目 | 楽曲の時間(分) |
---|---|---|
1 | cats celebrate you | 3.0 |
2 | 猫ダンス | 4.0 |
3 | TSUNAKAN | 5.5 |
4 | 畳の上ではディセンバー | 3.5 |
5 | ルビーの首輪 | 4.2 |
6 | 恋するフォーチュンカリカリ | 3.4 |
7 | WAになって眠ろう | 2.8 |
8 | 海も泳げるはず | 4.2 |
9 | かつおぶしだよ人生は | 4.7 |
10 | 破れかけのfusuma | 2.2 |
11 | 愛をこめてねこじゃらしを | 3.8 |
「四分位数(しぶんいすう)」とはデータを小さい順に並び替えたときに、データの数で4等分した時の区切り値のことです。4等分すると3つの区切りの値が得られ、小さいほうから「25パーセンタイル(第一四分位数)」、「50パーセンタイル(中央値)」、「75パーセンタイル(第三四分位数)」とよびます。
また、75パーセンタイル(第三四分位数)から25パーセンタイル(第一四分位数)を引いた値を「四分位範囲」とよびます。
■四分位数の求め方(データの数が奇数個の場合)
- 中央値を求める
- 中央値でデータを2つに分ける
- 2つに分けたデータのうち小さい値のグループを使って中央値を求める
- 2つに分けたデータのうち大きい値のグループを使って中央値を求める
データの数は全部で11個なので、小さい順に並べ替えたときの6番目の値が中央値になります。したがって「3.8」です。
2.2 | 2.8 | 3.0 | 3.4 | 3.5 | 3.8 | 4.0 | 4.2 | 4.2 | 4.7 | 5.5 |
小さい値のグループと大きい値のグループに分けます。ただし、データの数が奇数であり、中央値である6番目の値「3.8」はどちらかのグループに分けることができないため、「3.8」を除いて2つのグループに分けます。それぞれのグループには5個ずつのデータが含まれています。
【小さい値のグループ】
2.2 | 2.8 | 3.0 | 3.4 | 3.5 |
【大きい値のグループ】
4.0 | 4.2 | 4.2 | 4.7 | 5.5 |
データの数は全部で5個なので、小さい順に並べ替えたときの3番目の値が中央値になります。したがって「3.0」です。
【小さい値のグループ】
2.2 | 2.8 | 3.0 | 3.4 | 3.5 |
データの数は全部で5個なので、小さい順に並べ替えたときの3番目の値が中央値になります。したがって「4.2」です。
【大きい値のグループ】
4.0 | 4.2 | 4.2 | 4.7 | 5.5 |
これらをまとめると、四分位数は次のようになります。
第一四分位数 | 3.0 |
---|---|
第二四分位数 | 3.8 |
第三四分位数 | 4.2 |
四分位範囲 | 4.2-3.0=1.2 |
ところが、11番目の楽曲が終わるころ、なんと12番目に飛び入り参加がありました。12個のデータを使ってもう一度四分位数を求めなおしてみます。
順番 | 曲目 | 楽曲の時間(分) |
---|---|---|
12 | レット・キャット・ゴー | 4.6 |
■四分位数の求め方(データの数が偶数個の場合)
- 中央値を求める
- 半分に分ける
- 2つに分けたデータのうち小さい値のグループを使って中央値を求める
- 2つに分けたデータのうち大きい値のグループを使って中央値を求める
データの数は全部で12個なので、小さい順に並べ替えたときの6番目と7番目の値の平均値が中央値になります。したがって「{3.8+4.0}÷2=3.9」です。
2.2 | 2.8 | 3.0 | 3.4 | 3.5 | 3.8 | 4.0 | 4.2 | 4.2 | 4.6 | 4.7 | 5.5 |
小さい値のグループと大きい値のグループに分けます。データの数は偶数の12個なので、6番目の値「3.8」は小さい値のグループに、7番目の値「4.0」は大きい値のグループに分けられます。それぞれのグループには6個ずつのデータが含まれています。
【小さい値のグループ】
2.2 | 2.8 | 3.0 | 3.4 | 3.5 | 3.8 |
【大きい値のグループ】
4.0 | 4.2 | 4.2 | 4.6 | 4.7 | 5.5 |
データの数は全部で6個なので、小さい順に並べ替えたときの3番目の値と4番目の値の平均値が中央値になります。したがって「{3.0+3.4}÷2=3.2」です。
【小さい値のグループ】
2.2 | 2.8 | 3.0 | 3.4 | 3.5 | 3.8 |
データの数は全部で6個なので、小さい順に並べ替えたときの3番目の値と4番目の値の平均値が中央値になります。したがって「「{4.2+4.6}÷2=4.4」」です。
【大きい値のグループ】
4.0 | 4.2 | 4.2 | 4.6 | 4.7 | 5.5 |
これらをまとめると、四分位数は次のようになります。
第一四分位数 | 3.2 |
---|---|
第二四分位数 | 3.9 |
第三四分位数 | 4.4 |
四分位範囲 | 4.4-3.2=1.2 |