BellCurve 統計WEB

卒業後の追加講座も永年見放題
未経験からデータ分析が学べる
  • Step2. 中級編
  • 6. ノンパラメトリック検定

6-2. ノンパラメトリック検定 – 順位相関係数


26-3章で学んだピアソンの積率相関係数はデータが正規分布をしている場合にのみ使うことができます。データが正規分布に従わない場合は、ノンパラメトリックな手法であるスピアマンの順位相関係数もしくはケンドールの順位相関係数を使います。これらはどちらを使っても良く、手法の選択に関するルールはありません。

■スピアマンの順位相関係数

各変数の値を順位に変換してピアソンの積率相関係数を求めたものです。対になった変数XYn対のデータがあるとき、XYのそれぞれの値に対して順位をつけます。n対すべてについてi番目のデータX_iY_iの順位の差d_iを求めます。このd_iを使って以下の式から順位相関係数r_sを算出します。

2変数XYのデータの順位が全て一致する場合はr_s=1、どちらかの変数を逆順にする順位が全て一致する場合はr_s=-1となります。

【タイ(同順位)データが無い場合】

 \displaystyle r_s = 1 - \frac{6\displaystyle \sum_{i = 1}^n {d_i}^2}{n(n^2 - 1)}

【タイデータがある場合】

 \displaystyle r_s = \frac{T_x + T_y - \displaystyle \sum_{i = 1}^n {d_i}^2}{2\sqrt{T_xT_y}}

ただし、T_xT_yは次の式から求めます。n_xn_yはそれぞれ変数XYにおけるタイデータの個数を、t_it_jは各タイデータ含まれるデータの数を表します。タイデータに対しては、順位の中央値を使用します。

 \displaystyle T_x = \frac{n(n^2 - 1) - \displaystyle \sum_{i = 1}^{n_x} t_i({t_i}^2-1)}{12}
 \displaystyle T_y = \frac{n(n^2 - 1) - \displaystyle \sum_{j = 1}^{n_y} t_j({t_j}^2-1)}{12}

まず、タイデータを含まないデータからスピアマンの順位相関係数を求めてみます。

国語の点数数学の点数
A10090
B9580
C85100
D8075
E7050
F6060

  1. 各変数の順位を算出
  2. 国語の点数の順位数学の点数の順位
    A12
    B23
    C31
    D44
    E56
    F65

  3. 順位の差を算出
  4. 国語の点数の順位数学の点数の順位順位の差
    A12-1
    B23-1
    C312
    D440
    E56-1
    F651

  5. スピアマンの順位相関係数を算出
  6.  \displaystyle r_s = 1 - \frac{6\displaystyle \sum_{i = 1}^n {d_i}^2}{n(n^2 - 1)} = 1 - \frac{6 \times \{(-1)^2 + (-1)^2 + 2^2 + 0^2 + (-1)^2 + 1^2\}}{6(6^2 - 1)} = 1- \frac{48}{210} = 0.771

次に、タイデータを含むデータからスピアマンの順位相関係数を求めてみます。

国語の点数数学の点数
A100100
B95100
C85100
D8075
E8050
F6060

  1. 各変数の順位を算出
  2. タイデータには順位の中央値を付与します。

    国語の点数の順位数学の点数の順位
    A12
    B22
    C32
    D4.54
    E4.56
    F65

  3. 順位の差を算出
  4. 国語の点数の順位数学の点数の順位順位の差
    A12-1
    B220
    C321
    D4.540.5
    E4.56-1.5
    F651

  5. スピアマンの順位相関係数を算出
  6.  \displaystyle T_x = \frac{6(6^2 - 1) - \displaystyle \sum_{i = 1}^{1} 2({2}^2-1)}{12} = \frac{210 - 6}{12} = \frac{204}{12}
     \displaystyle T_y = \frac{6(6^2 - 1) - \displaystyle \sum_{j = 1}^{1} 3({3}^2-1)}{12} = \frac{210 - 24}{12} = \frac{186}{12}

    算出したT_xT_yの値を用います。

     \displaystyle r_s = \frac{T_x + T_y - \displaystyle \sum_{i = 1}^n {d_i}^2}{2\sqrt{T_xT_y}} = \frac{\frac{204}{12} + \frac{186}{12} - \{(-1)^2+0^2+1^2+0.5^2+(-1.5)^2+1^2\}}{2\sqrt{\frac{204}{12}\frac{186}{12}}} = \frac{\frac{204}{12} + \frac{186}{12} - 5.5}{\frac{2}{12}\sqrt{204 \times 186}} = \frac{204 + 186- 12 \times 5.5}{2\sqrt{204 \times 186}} = \frac{324}{389.58} = 0.832

■ケンドールの順位相関係数

データのペアの順序関係が2つのリストにおいてどれだけ一致しているかを算出したものです。対応する2つの変量(x_i, y_i)(ただし、i=1, 2, 3 \cdots n)があるとき、その中から取り出した(x_s, y_s)(x_t, y_t)(ただし、s<t)において、(x_s, y_s)(x_t, y_t)の大小関係が同じかどうかを用いて順位相関係数を計算します。

2変数のデータの大小関係が全て一致する場合は\tau=1、どちらかの変数を逆順にする大小関係が全て一致する場合は\tau=-1となります。

【タイデータが無い場合】

 \displaystyle \tau_a = \frac{P-Q}{N}

ただし、

  • P = (x_s, y_s)(x_t, y_t)との大小関係が同じ向きである組の数 = x_sx_ty_sy_tの大小関係が一致する組の数
  • Q = (x_s, y_s)(x_t, y_t)との大小関係が異なる向きである組の数 = x_sx_ty_sy_tの大小関係が不一致である組の数
  • N = 比較したデータの組の総数:N(N-1)/2


【タイデータがある場合】

タイデータに対しては、順位の中央値を使用します。

 \displaystyle \tau_b = \frac{P - Q}{\sqrt{N - T_x}\sqrt{N - T_y}}

ただし、

  • T_x = (x_s=x_t)である組の数
  • T_y = (y_s=y_t)である組の数

まず、タイデータを含まないデータからケンドールの順位相関係数を求めてみます。

国語の点数数学の点数
A10090
B9580
C85100
D8075
E7050
F6060

  1. 各変数の順位を算出
  2. 国語の点数の順位数学の点数の順位
    A12
    B23
    C31
    D44
    E56
    F65

  3. すべてのペアの大小関係を調べる
    • (1, 2)と(2, 3) → 一致
    • (1, 2)と(3, 1) → 不一致
    • (1, 2)と(4, 4) → 一致
    • (1, 2)と(5, 6) → 一致
    • (1, 2)と(6, 5) → 一致
    • (2, 3)と(3, 1) → 不一致
    • (2, 3)と(4, 4) → 一致
    • (2, 3)と(5, 6) → 一致
    • (2, 3)と(6, 5) → 一致
    • (3, 1)と(4, 4) → 一致
    • (3, 1)と(5, 6) → 不一致
    • (3, 1)と(6, 5) → 一致
    • (4, 4)と(5, 6) → 一致
    • (4, 4)と(6, 5) → 一致
    • (5, 6)と(6, 5) → 一致
  4. すべてのペアの大小関係を集計
    • P = 12
    • Q = 3
    • N = 15
  5. ケンドールの順位相関係数を算出
  6.  \displaystyle \tau_a = \frac{12-3}{15} = 0.6

次に、タイデータを含むデータからスピアマンの順位相関係数を求めてみます。

国語の点数数学の点数
A100100
B95100
C85100
D8075
E8050
F6060

  1. 各変数の順位を算出
  2. タイデータには順位の中央値を付与します。

    国語の点数の順位数学の点数の順位
    A12
    B22
    C32
    D4.54
    E4.56
    F65

  3. すべてのペアの大小関係を調べる
    • (1, 2)と(2, 2) → yが等しい
    • (1, 2)と(3, 2) → yが等しい
    • (1, 2)と(4, 4) → 一致
    • (1, 2)と(5, 6) → 一致
    • (1, 2)と(6, 5) → 一致
    • (2, 2)と(3, 2) → yが等しい
    • (2, 2)と(4.5, 4) → 一致
    • (2, 2)と(4.5, 6) → 一致
    • (2, 2)と(6, 5) → 一致
    • (3, 2)と(4.5, 4) → 一致
    • (3, 2)と(4.5, 6)→ 不一致
    • (3, 2)と(6, 5) → 一致
    • (4.5, 4)と(4.5, 6)→ xが等しい
    • (4.5, 4)と(6, 5) → 一致
    • (4.5, 6)と(6, 5) → 一致
  4. すべてのペアの大小関係を集計
    • P = 10
    • Q = 1
    • N = 15
    • T_x = 1
    • T_y = 3
  5. ケンドールの順位相関係数を算出
  6.  \displaystyle \tau_b = \frac{10 - 1}{\sqrt{15 - 1}\sqrt{15 - 3}} =0.694

6. ノンパラメトリック検定


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)