BellCurve 統計WEB

  • Step1. 初級編
  • 3. さまざまな代表値

3-1. 平均・中央値・モード

数値からなるデータがある場合に、そのデータを端的に表す値のことを「代表値」といいます。代表値として使われる値には以下のようなものがあります。

  1. 平均
  2. 中央値
  3. モード(最頻値)

1. 平均

平均は、全てのデータの値(x_1,x_2, \cdots ,x_n)を足してデータの数(n)で割ったものです。式で表すと次のようになります。「\bar{x}」は「エックスバー」と読み、データxの平均であることを示します。

 \bar{x}=\displaystyle \frac{\left( x_1 + x_2 + x_3 + \cdots +x_n \right)}{n}

もしデータが度数分布表の形になっている場合は、「階級値」と「度数」を使って平均を算出できます。n個の階級を持つ度数分布表の場合、階級値をv_{i}、度数をf_{i}(i=1, 2, …, n)とすると次の式になります。

 \bar{X}=\displaystyle \frac{\left( f_1 v_1 + f_2 v_2 + \cdots +f_n v_n \right)}{\left( f_1 + f_2 + \cdots + f_n \right) }

例えば、次に示すあるクラスの生徒の身長の度数分布表について考えてみます。

階級階級値度数
140~150 cm145 cm2
150~160 cm155 cm5
160~170 cm165 cm7
170~180 cm175 cm3

この場合、身長の平均は次のように計算します。

 \bar{X}=\displaystyle \frac{\left( 145 \times 2 + 155 \times 5 + 165 \times 7 + 175 \times 3 \right)}{\left( 2+5+7+3 \right) }

2. 中央値

中央値はメディアン(Median)ともよばれます。データを小さい順に並べたときにちょうど真ん中に来る値のことです。

例えば「1, 1, 2, 4, 5, 8, 9, 10, 11」というデータの場合、中央値は「5」です。もしデータの数が偶数の場合、例えば「1, 1, 2, 4, 5, 8, 9, 10, 11,14」というデータの場合、中央にある2つの値「5」と「8」の平均が中央値となります。したがって、中央値は(5+8)/2=6.5です。

3. モード(最頻値)

モードは最頻値とも呼ばれ、最もデータ数の多い値を指します。例えば「1, 1, 2, 4, 5, 8, 9, 10, 11」というデータの場合、モードは「1」です。

また、度数分布表では最も度数の大きい階級値がモードとなります。次に示すあるクラスの生徒の身長の度数分布表の場合、最も度数の大きい階級は「160~170cm」であり、モードはその階級値である165cmとなります。

階級階級値度数
140~150 cm145 cm2
150~160 cm155 cm5
160~170 cm165 cm7
170~180 cm175 cm3

【コラム】モードの数

モードは、データの中で頻度が最も高い値のことですが、データによってはモードが2つある場合があります。例えば「0, 1, 1, 1, 2, 4, 5, 8, 9, 9, 9, 10」というデータの場合、モードは「1」と「9」になります。

一方、「0, 1, 2, 4, 5, 8, 9, 10」というデータの場合、モードはありません。

3. さまざまな代表値