BellCurve 統計WEB

  • Step2. 中級編
  • 5. 統計的検定

5-1. 適合度検定

■適合度検定

25-4章で適合度の検定について学びました。適合度検定とは、度数分布表において実測度数と理論度数が一致するかどうかを検定する方法で、カイ二乗分布を使って検定を行います。

ここでは次の表に示すように、実測値f、理論確率p、総実測数nを用いた2×2のクロス集計表について考えてみます。

カテゴリーCC_1C_2合計
実測値f_1f_2n
理論確率p_1p_21
理論値np_1np_2n

このとき、次の式で表されるカイ二乗値は自由度1のカイ二乗分布に従います。

 \displaystyle \chi^2 = \sum^{2}_{i=1}{\frac{(f_i-np_i)^2}{np_i}}

この式を展開すると、

     \begin{eqnarray*} \displaystyle \chi^2 &=& \sum^{2}_{i=1}{\frac{(f_i-np_i)^2}{np_i}} \\ &=& \frac{(f_1-np_1)^2}{np_1} + \frac{(f_2-np_2)^2}{np_2} \\ &=& \frac{(f_1-np_1)^2}{np_1} + \frac{(n-f_1-n(1-p_1))^2}{n(1-p_1)} \\ &=& \frac{1}{n} \times \frac{(f_1-np_1)^2}{p_1} + \frac{(n-f_1-n-np_1))^2}{(1-p_1)} \\ &=& \frac{1}{n} \times \frac{(1-p_1)(f_1-np_1)^2}{p_1(1-p_1)} + \frac{p_1(f_1-np_1)^2}{p_1(1-p_1)} \\ &=& \frac{1}{n} \times \frac{(1-p_1)(f_1-np_1)^2 + p_1(f_1-np_1)^2}{p_1(1-p_1)} \\ &=& \frac{1}{n} \times \frac{(1-p_1+p_1)(f_1-np_1)^2}{p_1(1-p_1)} \\ &=& \frac{1}{n} \times \frac{(f_1-np_1)^2}{p_1(1-p_1)} \\ &=& \frac{(f_1-np_1)^2}{np_1(1-p_1)} \\ &=& \left\{ \frac{f_1-np_1}{\sqrt{np_1(1-p_1)}} \right\}^2 \\ \end{eqnarray*}

となります。ここでp_1は「あるサンプルがカテゴリーC_1となる確率」であることから,f_1は試行回数n、成功確率p_1の二項分布Bi(n, p_1)に従います。13-2章で学んだように、二項分布Bi(n, p1)の期待値はnp_1,分散はnp_1(1−p_1)であることから、中心極限定理により、nが十分に大きいときには\displaystyle \frac{f_1-np_1}{\sqrt{np_1(1-p_1)}}は標準正規分布に従います。

22-1章で学んだように、標準正規分布の二乗和はカイ二乗分布に従うことから、\left\{ \frac{f_1-np_1}{\sqrt{np_1(1-p_1)}} \right\}^2は自由度1のカイ二乗分布に従います。

5. 統計的検定


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)