- Step1. 基礎編
- 19. 母平均の区間推定(母分散既知)
19-3. 95%信頼区間のもつ意味
「95%信頼区間」とは、「正規分布に従う母集団から標本を取ってきてその平均から95%信頼区間を求めた時に、その区間の中に95%の確率で母平均が含まれる」という意味だと思う人がいるかもしれませんが、これは不正確です。
母平均は決まった値(定数)であり、確率的に変化することはありません。つまり、算出された信頼区間に母平均が「含まれる」か「含まれない」かのどちらかしかありえません。したがって、「母平均が、95%の"確率"で推定した信頼区間に含まれる」と言うことはできません。
正しくは、「母集団から標本を取ってきて、その平均から95%信頼区間を求める、という作業を100回やったときに、95回はその区間の中に母平均が含まれる」という"頻度"もしくは"割合"を意味します。
例えば日本人全員の平均身長(=母平均)が170cmであるとします。このときに、ランダムに選ばれた100人の身長から95%信頼区間を算出する実験を100回行います。その結果、次のように
1個目の実験:150 175
2個目の実験:162 172
3個目の実験:171 179
︙
100個目の実験:145 180
というような信頼区間が算出されるとします。これら100個の信頼区間のうち、5個くらいは母平均である170を含まない範囲になっていると考えられます。95%信頼区間とはこのようなことを意味しているのです。
【コラム】信用区間
「信頼区間」と似た言葉に「信用区間」というものがあります。信用区間はベイズ統計学における区間推定で使われるもので、例えば母平均の区間推定を行ったときの95%信用区間とは「母平均が95%の確率で推定された信用区間に含まれる」ということを意味します。
■おすすめ書籍
医療系の方で、統計を使う方には大変オススメの本です。医学統計の本は数も多く、ともすれば難しく書かれていたりするものもありますが、このシリーズは読み物のように軽く読めると思います。他に第2巻、第3巻があります。