- Step1. 基礎編
- 23. 検定の前に
23-2. 検定で使う用語
23-1章では、次に示すようにコインを用いた検定の流れについて学びました。
50%の確率で表が出る普通のコインと、10%の確率でしか表が出ない不正なコインがどちらも2枚ずつあり、「普通のコインだよ」と言ってどちらかのコイン2枚組を渡されたとします。渡された2枚のコインを投げる試行を2回繰り返したところ、2回ともすべて裏でした。
「“稀である”と判断する確率の基準」を10%とした場合、この結果を元に検定を行うと「渡されたコインは普通のコインであるとは考えられない」という結論になります。すなわち、「渡されたコインは普通のコイン」が正しいと仮定したとき、観測した事象が起こる確率は6.25%であり、6.25%は10%より小さいためです。
このコインの問題を使って、検定で使われる用語について解説します。
■帰無仮説と対立仮説
検定を行うため立てる仮説のことを「帰無仮説」といいます。帰無仮説に対する仮説のことを「対立仮説」といいます。これらの仮説に用いられる「」は「hypothesis」の頭文字です。
コインの問題では「コインが普通のものか不正のものか」を検証するために、仮説を次のように設定しています。
- 帰無仮説:「渡されたのは普通のコインである」
- 対立仮説:「渡されたのは不正なコインである」
■検定統計量とP値
検定統計量から算出されたP値を元に検定の結論を導きます。
- 検定統計量:帰無仮説が正しいと仮定したときに、観測した事象よりも稀なことが起こる確率を計算するための値です。簡単に「統計量」とよばれる場合もあります。
- P値:帰無仮説が正しいとした仮定とき、観測した事象よりも稀なことが起こる確率のことです。「観測した事象よりも稀な事象が起こる確率」であることから、これは累積確率となっています。コインの問題では、「6.25%」がP値になります。
P値はその大小を比較するものではないため、例えばP値が小さいほど差が大きいといったことを意味するわけではありません。ある事象が起こる「確率」を表すものであり、あくまでも事前に設定した有意水準(次項で説明)と比較するためのものにすぎません。
■有意水準と棄却
帰無仮説を棄却する基準を有意水準といいます。
- 有意水準:帰無仮説を棄却するための基準となる確率です。この数値は検定を行う前に決めておく必要があります。危険率と呼ばれることもあります。コインの問題では、「“稀である”と判断する確率の基準」がこの有意水準です。
- 棄却:仮説を捨てることです。P値が有意水準よりも小さい時は、帰無仮説を捨て対立仮説を採択します。すなわち、対立仮説が正しいと結論付けられます。コインの問題では、基準である「10%」と観測した事象の起こる確率「6.25%」を比べた結果、「6.25%」が「10%」より小さいことが分かりました。このとき、帰無仮説「渡されたコインは普通のものである」を「棄却」し、対立仮説「渡されたのは不正なコインである」を採択します。
P値が有意水準よりも大きい時は、帰無仮説は棄却されません。これは帰無仮説が正しいと結論づけて良いということを意味しません。検定で用いられる方法は「背理法」なので、「帰無仮説が棄却されない」ことは「帰無仮説が正しいと結論づけて良い」ということにはなりません。この場合、「対立仮説が正しいと結論づけることはできない」ということしか言えないのです。
23. 検定の前に
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 9. 確率と期待値
9-1. 確率
- 12. 累積分布関数と確率変数の期待値・分散
12-1. 累積分布関数とは
- 13. いろいろな確率分布1
13-1. 二項分布
- ブログ
よくある間違い
- ブログ
p値と有意水準
- ブログ
P = 0.05 だったら