BellCurve 統計WEB

  • Step2. 中級編
  • 6. ノンパラメトリック検定

6-5. ノンパラメトリック検定 – 対応のない3群以上のデータの差の検定

29章では3群以上からなるデータの平均値の差の検定方法である分散分析について学びました。

ここでは、一元配置分散分析のノンパラメトリック検定版である「クラスカル=ウォリス検定」について学びます。

■クラスカル=ウォリス検定

k群からなるデータをひとまとめにして順位をつけます。タイデータに対しては、順位の中央値を使用します。付与した順位を群ごとに足し合わせ、順位の合計値 R_i (i = 1, 2, \dots, k) を算出します。R_iと各群のサンプルサイズ n_i を用いて次の式からクラスカル=ウォリスの統計量 H を計算します(N は全データの総数を表します)。この H が近似的に自由度 (k - 1) のカイ二乗分布に従うことを用いて検定を行います。

 \displaystyle H = \frac{12}{N(N+1)} \sum^{k}_{i=1} {n_i \left(\frac{R_i}{n_i}-\frac{N+1}{2}\right)^2}

あるいは

 \displaystyle H = \frac{12}{N(N + 1)} \sum_{i = 1}^k {\frac {{R_i}^2}{n_i}} - 3(N + 1)


次のデータを使ってクラスカル=ウォリス検定を行ってみます。

No.A班の身長(cm)B班の身長(cm)C班の身長(cm)
1170155170
2155165145
3140180150
4165185135
5160175-
6-160-

  1. 全体の値に対して順位を付与
  2. 身長を小さい順に並べると「135 < 140 < 145 < 150 < 155, 155 < 160, 160 < 165, 165 < 170, 170 < 175 < 180 < 185」となります。

    並べ替えた身長に対して順位を付与すると「1 < 2 < 3 < 4 < 5.5, 5.5 < 7.5, 7.5 < 9.5, 9.5 < 11.5, 11.5 < 13 < 114 < 15」となります。

    No.A班の身長(cm)B班の身長(cm)C班の身長(cm)
    111.55.511.5
    25.59.53
    32144
    49.5151
    57.513-
    6-7.5-

  3. 標本ごとに順位の和を算出
  4. No.A班の身長(cm)B班の身長(cm)C班の身長(cm)
    111.55.511.5
    25.59.53
    32144
    49.5151
    57.513-
    6-7.5-
    R(順位和)3664.519.5
    n(サンプルサイズ)564

  5. クラスカル=ウォリス検定を行う
  6. 検定統計量 H を計算すると

         \begin{eqnarray*} \displaystyle H &=& \frac{12}{15(15+1)} \left\{ 5\left(\frac{36}{5}-\frac{15+1}{2}\right)^2 + 6\left(\frac{64.5}{6}-\frac{15+1}{2}\right)^2 + 4\left(\frac{19.5}{4}-\frac{15+1}{2}\right)^2 \right\} \\ &=& 0.05 \times (3.2 + 45.375 + 39.063) \\ &=& 4.382 \end{eqnarray*}

    となります。自由度 3-1=2 のカイ二乗検定を用いて検定を行うと、P(H \geq 4.382) となる確率(片側検定のP値)を求めると P=0.112 となります。クラスカル=ウォリス検定では、平均順位に対する各変数における順位のズレがどのくらい大きかについて検定をするので、必ず「片側検定」となります。

6. ノンパラメトリック検定


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)