- Step2. 中級編
- 6. ノンパラメトリック検定
6-2. ノンパラメトリック検定 – 順位相関係数
26-3章で学んだピアソンの積率相関係数はデータが正規分布をしている場合にのみ使うことができます。データが正規分布に従わない場合は、ノンパラメトリックな手法であるスピアマンの順位相関係数もしくはケンドールの順位相関係数を使います。これらはどちらを使っても良く、手法の選択に関するルールはありません。
■スピアマンの順位相関係数
各変数の値を順位に変換してピアソンの積率相関係数を求めたものです。対になった変数と
に
対のデータがあるとき、
と
のそれぞれの値に対して順位をつけます。
対すべてについて
番目のデータ
と
の順位の差
を求めます。この
を使って以下の式から順位相関係数
を算出します。
2変数と
のデータの順位が全て一致する場合は
、どちらかの変数を逆順にする順位が全て一致する場合は
となります。
【タイ(同順位)データが無い場合】
![Rendered by QuickLaTeX.com \displaystyle r_s = 1 - \frac{6\displaystyle \sum_{i = 1}^n {d_i}^2}{n(n^2 - 1)}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-a224aca0fb597b408d63490193f79282_l3.png)
【タイデータがある場合】
![Rendered by QuickLaTeX.com \displaystyle r_s = \frac{T_x + T_y - \displaystyle \sum_{i = 1}^n {d_i}^2}{2\sqrt{T_xT_y}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-02f3b513b5ac1f73fed75393c770c8ab_l3.png)
ただし、と
は次の式から求めます。
と
はそれぞれ変数
と
におけるタイデータの個数を、
と
は各タイデータ含まれるデータの数を表します。タイデータに対しては、順位の中央値を使用します。
![Rendered by QuickLaTeX.com \displaystyle T_x = \frac{n(n^2 - 1) - \displaystyle \sum_{i = 1}^{n_x} t_i({t_i}^2-1)}{12}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-40c3f5125eafa1193151165a886c1682_l3.png)
![Rendered by QuickLaTeX.com \displaystyle T_y = \frac{n(n^2 - 1) - \displaystyle \sum_{j = 1}^{n_y} t_j({t_j}^2-1)}{12}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-3f935bb343e9f18710491f1cbcbc97fb_l3.png)
まず、タイデータを含まないデータからスピアマンの順位相関係数を求めてみます。
国語の点数 | 数学の点数 | |
---|---|---|
A | 100 | 90 |
B | 95 | 80 |
C | 85 | 100 |
D | 80 | 75 |
E | 70 | 50 |
F | 60 | 60 |
- 各変数の順位を算出
- 順位の差を算出
- スピアマンの順位相関係数を算出
国語の点数の順位 | 数学の点数の順位 | |
---|---|---|
A | 1 | 2 |
B | 2 | 3 |
C | 3 | 1 |
D | 4 | 4 |
E | 5 | 6 |
F | 6 | 5 |
国語の点数の順位 | 数学の点数の順位 | 順位の差 | |
---|---|---|---|
A | 1 | 2 | -1 |
B | 2 | 3 | -1 |
C | 3 | 1 | 2 |
D | 4 | 4 | 0 |
E | 5 | 6 | -1 |
F | 6 | 5 | 1 |
![Rendered by QuickLaTeX.com \displaystyle r_s = 1 - \frac{6\displaystyle \sum_{i = 1}^n {d_i}^2}{n(n^2 - 1)} = 1 - \frac{6 \times \{(-1)^2 + (-1)^2 + 2^2 + 0^2 + (-1)^2 + 1^2\}}{6(6^2 - 1)} = 1- \frac{48}{210} = 0.771](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-41c8c9636c699991e82401b2d6e9fb0b_l3.png)
次に、タイデータを含むデータからスピアマンの順位相関係数を求めてみます。
国語の点数 | 数学の点数 | |
---|---|---|
A | 100 | 100 |
B | 95 | 100 |
C | 85 | 100 |
D | 80 | 75 |
E | 80 | 50 |
F | 60 | 60 |
- 各変数の順位を算出
- 順位の差を算出
- スピアマンの順位相関係数を算出
タイデータには順位の中央値を付与します。
国語の点数の順位 | 数学の点数の順位 | |
---|---|---|
A | 1 | 2 |
B | 2 | 2 |
C | 3 | 2 |
D | 4.5 | 4 |
E | 4.5 | 6 |
F | 6 | 5 |
国語の点数の順位 | 数学の点数の順位 | 順位の差 | |
---|---|---|---|
A | 1 | 2 | -1 |
B | 2 | 2 | 0 |
C | 3 | 2 | 1 |
D | 4.5 | 4 | 0.5 |
E | 4.5 | 6 | -1.5 |
F | 6 | 5 | 1 |
![Rendered by QuickLaTeX.com \displaystyle T_x = \frac{6(6^2 - 1) - \displaystyle \sum_{i = 1}^{1} 2({2}^2-1)}{12} = \frac{210 - 6}{12} = \frac{204}{12}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-64524347f7294b10f89a840678779a49_l3.png)
![Rendered by QuickLaTeX.com \displaystyle T_y = \frac{6(6^2 - 1) - \displaystyle \sum_{j = 1}^{1} 3({3}^2-1)}{12} = \frac{210 - 24}{12} = \frac{186}{12}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-8091683e6ca9e71cda8deb30158194aa_l3.png)
算出したと
の値を用います。
![Rendered by QuickLaTeX.com \displaystyle r_s = \frac{T_x + T_y - \displaystyle \sum_{i = 1}^n {d_i}^2}{2\sqrt{T_xT_y}} = \frac{\frac{204}{12} + \frac{186}{12} - \{(-1)^2+0^2+1^2+0.5^2+(-1.5)^2+1^2\}}{2\sqrt{\frac{204}{12}\frac{186}{12}}} = \frac{\frac{204}{12} + \frac{186}{12} - 5.5}{\frac{2}{12}\sqrt{204 \times 186}} = \frac{204 + 186- 12 \times 5.5}{2\sqrt{204 \times 186}} = \frac{324}{389.58} = 0.832](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-3a76fc76e3efdfd5c9c3f3a10ad06453_l3.png)
■ケンドールの順位相関係数
データのペアの順序関係が2つのリストにおいてどれだけ一致しているかを算出したものです。対応する2つの変量(ただし、
)があるとき、その中から取り出した
と
(ただし、
)において、
と
の大小関係が同じかどうかを用いて順位相関係数を計算します。
2変数のデータの大小関係が全て一致する場合は、どちらかの変数を逆順にする大小関係が全て一致する場合は
となります。
【タイデータが無い場合】
![Rendered by QuickLaTeX.com \displaystyle \tau_a = \frac{P-Q}{N}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-2a2c69ab247e6d3780ebcfe074f1e0dc_l3.png)
ただし、
- P =
と
との大小関係が同じ向きである組の数 =
と
、
と
の大小関係が一致する組の数
- Q =
と
との大小関係が異なる向きである組の数 =
と
、
と
の大小関係が不一致である組の数
- N = 比較したデータの組の総数:
【タイデータがある場合】
タイデータに対しては、順位の中央値を使用します。
![Rendered by QuickLaTeX.com \displaystyle \tau_b = \frac{P - Q}{\sqrt{N - T_x}\sqrt{N - T_y}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-25e2947d32f069fc156e9895ff837a10_l3.png)
ただし、
= (
)である組の数
= (
)である組の数
まず、タイデータを含まないデータからケンドールの順位相関係数を求めてみます。
国語の点数 | 数学の点数 | |
---|---|---|
A | 100 | 90 |
B | 95 | 80 |
C | 85 | 100 |
D | 80 | 75 |
E | 70 | 50 |
F | 60 | 60 |
- 各変数の順位を算出
- すべてのペアの大小関係を調べる
- (1, 2)と(2, 3) → 一致
- (1, 2)と(3, 1) → 不一致
- (1, 2)と(4, 4) → 一致
- (1, 2)と(5, 6) → 一致
- (1, 2)と(6, 5) → 一致
- (2, 3)と(3, 1) → 不一致
- (2, 3)と(4, 4) → 一致
- (2, 3)と(5, 6) → 一致
- (2, 3)と(6, 5) → 一致
- (3, 1)と(4, 4) → 一致
- (3, 1)と(5, 6) → 不一致
- (3, 1)と(6, 5) → 一致
- (4, 4)と(5, 6) → 一致
- (4, 4)と(6, 5) → 一致
- (5, 6)と(6, 5) → 一致
- すべてのペアの大小関係を集計
- P = 12
- Q = 3
- N = 15
- ケンドールの順位相関係数を算出
国語の点数の順位 | 数学の点数の順位 | |
---|---|---|
A | 1 | 2 |
B | 2 | 3 |
C | 3 | 1 |
D | 4 | 4 |
E | 5 | 6 |
F | 6 | 5 |
![Rendered by QuickLaTeX.com \displaystyle \tau_a = \frac{12-3}{15} = 0.6](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-ac12ba4bfd02b4e0c327f0fb7ceccd55_l3.png)
次に、タイデータを含むデータからスピアマンの順位相関係数を求めてみます。
国語の点数 | 数学の点数 | |
---|---|---|
A | 100 | 100 |
B | 95 | 100 |
C | 85 | 100 |
D | 80 | 75 |
E | 80 | 50 |
F | 60 | 60 |
- 各変数の順位を算出
- すべてのペアの大小関係を調べる
- (1, 2)と(2, 2) → yが等しい
- (1, 2)と(3, 2) → yが等しい
- (1, 2)と(4, 4) → 一致
- (1, 2)と(5, 6) → 一致
- (1, 2)と(6, 5) → 一致
- (2, 2)と(3, 2) → yが等しい
- (2, 2)と(4.5, 4) → 一致
- (2, 2)と(4.5, 6) → 一致
- (2, 2)と(6, 5) → 一致
- (3, 2)と(4.5, 4) → 一致
- (3, 2)と(4.5, 6)→ 不一致
- (3, 2)と(6, 5) → 一致
- (4.5, 4)と(4.5, 6)→ xが等しい
- (4.5, 4)と(6, 5) → 一致
- (4.5, 6)と(6, 5) → 一致
- すべてのペアの大小関係を集計
- P = 10
- Q = 1
- N = 15
= 1
= 3
- ケンドールの順位相関係数を算出
タイデータには順位の中央値を付与します。
国語の点数の順位 | 数学の点数の順位 | |
---|---|---|
A | 1 | 2 |
B | 2 | 2 |
C | 3 | 2 |
D | 4.5 | 4 |
E | 4.5 | 6 |
F | 6 | 5 |
![Rendered by QuickLaTeX.com \displaystyle \tau_b = \frac{10 - 1}{\sqrt{15 - 1}\sqrt{15 - 3}} =0.694](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-497c38030d9dd61ec8c74aedad7fd4c0_l3.png)
6. ノンパラメトリック検定
- 6-1. ノンパラメトリック検定とは
- 6-2. ノンパラメトリック検定 – 順位相関係数
- 6-3. ノンパラメトリック検定 – 対応のない2標本の差の検定
- 6-4. ノンパラメトリック検定 – 対応のある2標本の差の検定
- 6-5. ノンパラメトリック検定 – 対応のない3群以上のデータの差の検定