4-2. 四分位数を見てみよう | 統計学の時間 | 統計WEB

BellCurve 統計WEB

  • Step0. 初級編
  • 4. 代表値と箱ひげ図

4-2. 四分位数を見てみよう

日が落ちて境内のメインステージではカラオケ大会が始まりました。赤い提灯がステージ上の猫たちを一層盛り上げているようです。

■四分位数

次の表はカラオケ大会のプログラムです。今年のカラオケ大会には全部で11匹のエントリーがありました。このプログラムの楽曲の時間から四分位数を求めてみます。

順番曲目楽曲の時間(分)
1cats celebrate you3.0
2猫ダンス4.0
3TSUNAKAN5.5
4畳の上ではディセンバー3.5
5ルビーの首輪4.2
6恋するフォーチュンカリカリ3.4
7WAになって眠ろう2.8
8海も泳げるはず4.2
9かつおぶしだよ人生は4.7
10破れかけのfusuma2.2
11愛をこめてねこじゃらしを3.8

「四分位数(しぶんいすう)」とはデータを小さい順に並び替えたときに、データの数で4等分した時の区切り値のことです。4等分すると3つの区切りの値が得られ、小さいほうから「25パーセンタイル(第一四分位数)」、「50パーセンタイル(中央値)」、「75パーセンタイル(第三四分位数)」とよびます。

また、75パーセンタイル(第三四分位数)から25パーセンタイル(第一四分位数)を引いた値を「四分位範囲」とよびます。

■四分位数の求め方(データの数が奇数個の場合)

  1. 中央値を求める
  2. データの数は全部で11個なので、小さい順に並べ替えたときの6番目の値が中央値になります。したがって「3.8」です。

    2.22.83.03.43.53.84.04.24.24.75.5

  3. 中央値でデータを2つに分ける
  4. 小さい値のグループと大きい値のグループに分けます。ただし、データの数が奇数であり、中央値である6番目の値「3.8」はどちらかのグループに分けることができないため、「3.8」を除いて2つのグループに分けます。それぞれのグループには5個ずつのデータが含まれています。

    【小さい値のグループ】

    2.22.83.03.43.5

    【大きい値のグループ】

    4.04.24.24.75.5

  5. 2つに分けたデータのうち小さい値のグループを使って中央値を求める
  6. データの数は全部で5個なので、小さい順に並べ替えたときの3番目の値が中央値になります。したがって「3.0」です。

    【小さい値のグループ】

    2.22.83.03.43.5

  7. 2つに分けたデータのうち大きい値のグループを使って中央値を求める
  8. データの数は全部で5個なので、小さい順に並べ替えたときの3番目の値が中央値になります。したがって「4.2」です。

    【大きい値のグループ】

    4.04.24.24.75.5

これらをまとめると、四分位数は次のようになります。

第一四分位数3.0
第二四分位数3.8
第三四分位数4.2
四分位範囲4.2-3.0=1.2




ところが、11番目の楽曲が終わるころ、なんと12番目に飛び入り参加がありました。12個のデータを使ってもう一度四分位数を求めなおしてみます。

順番曲目楽曲の時間(分)
12レット・キャット・ゴー4.6

■四分位数の求め方(データの数が偶数個の場合)

  1. 中央値を求める
  2. データの数は全部で12個なので、小さい順に並べ替えたときの6番目と7番目の値の平均値が中央値になります。したがって「{3.8+4.0}÷2=3.9」です。

    2.22.83.03.43.53.84.04.24.24.64.75.5

  3. 半分に分ける
  4. 小さい値のグループと大きい値のグループに分けます。データの数は偶数の12個なので、6番目の値「3.8」は小さい値のグループに、7番目の値「4.0」は大きい値のグループに分けられます。それぞれのグループには6個ずつのデータが含まれています。

    【小さい値のグループ】

    2.22.83.03.43.53.8

    【大きい値のグループ】

    4.04.24.24.64.75.5

  5. 2つに分けたデータのうち小さい値のグループを使って中央値を求める
  6. データの数は全部で6個なので、小さい順に並べ替えたときの3番目の値と4番目の値の平均値が中央値になります。したがって「{3.0+3.4}÷2=3.2」です。

    【小さい値のグループ】

    2.22.83.03.43.53.8

  7. 2つに分けたデータのうち大きい値のグループを使って中央値を求める
  8. データの数は全部で6個なので、小さい順に並べ替えたときの3番目の値と4番目の値の平均値が中央値になります。したがって「「{4.2+4.6}÷2=4.4」」です。

    【大きい値のグループ】

    4.04.24.24.64.75.5

これらをまとめると、四分位数は次のようになります。

第一四分位数3.2
第二四分位数3.9
第三四分位数4.4
四分位範囲4.4-3.2=1.2

4. 代表値と箱ひげ図