BellCurve 統計WEB

  • Step1. 初級編
  • 31. 実験計画

31-2. 効果量1

「サンプルサイズが大きいほうが母平均をより正確に推測できる」ことは17-2章の大数の法則で既に学びました。しかし、ヒトや動物を対象にした安全性に関する実験や非常にコストの高い実験では、むやみやたらとサンプルサイズを大きくすることはできません。このようなときには「有意水準」、「効果量」、「検出力」を考えた上でサンプルサイズを考えます。

この章ではまず「効果量」について説明します。

効果量は「検出したい差の程度」や「変数間の関係の強さ」のことで、その実験の効果を見るための指標です。P値はその値より極端な値をとる確率を示したものに過ぎないため、その実験において実際にどの程度の効果があったかを知ることはできません。17-4章の中心極限定理で学んだように、サンプルサイズが大きいほうが平均値のばらつきは少ないため、例えば同じ平均値の2群を比較した場合にはサンプルサイズが大きい方がP値は小さくなります。

例題1:

ある学校で、試験対策として20人の生徒に対して補習授業を行いました。この補習授業の効果はあったと言えるでしょうか。

補習前(点) 補習後(点)
97 98
69 46
90 78
65 76
47 59
20 32
89 65
98 70
100 100
83 92
66 89
77 71
29 55
87 100
52 67
50 65
81 86
80 79
60 96
73 94

補習授業前の平均は70.65点、一方で補習後の平均は75.9点でした。対応のあるt検定(片側検定)を行ってみるとP値は0.0936となり、有意水準を5%とすると帰無仮説H_0「補習前と補習後の点数の差は0である」は棄却されないという結果になります。したがって、補習前後での点数に差があるとはいえないと結論付けられます。

例題2:

ある学校で、試験対策として40人の生徒に対して補習授業を行いました。この補習授業の効果はあったと言えるでしょうか。

補習前(点) 補習後(点)
97 98
46 69
90 78
65 76
47 59
20 32
89 65
98 70
100 100
83 92
66 89
77 71
29 55
87 100
52 67
50 65
81 86
80 79
60 96
73 94
81 83
32 34
56 51
55 97
85 96
56 98
95 97
52 62
94 98
44 41
78 73
80 98
40 41
68 60
77 59
78 99
65 67
65 56
42 60
67 86

平均点は先程の例題1と同じです(わざとそういうデータにしているためです)が、P値を見てみると0.0286となりました。5%有意水準の元では帰無仮説H_0「補習前と補習後の点数の差は0である」は棄却されます。したがって、補習後の点数は補習前の点数と比較して高くなったと結論付けられます。

平均値は同じなのに生徒の数が増えたことでP値が小さくなりました。そこで、サンプルサイズによらない効果を示す指標である「効果量」が必要となるわけです。

31. 実験計画

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。