- Step1. 基礎編
- 21. 母比率の区間推定
21-1. 母比率の信頼区間の求め方1
母平均の推定と同じように、母比率についても区間推定を行うことができます。成功確率がである試行をn回行うときに成功する回数を
とすると、
は二項分布
に従うことは13-1章で既に学びました。この
が母比率に対応します。
また、二項分布に従う確率変数の期待値と分散はそれぞれ次のようになることは13-2章で既に学びました。
![Rendered by QuickLaTeX.com \displaystyle E(X)=np](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c686931aafb7c0ec59867d5a285d08cd_l3.png)
![Rendered by QuickLaTeX.com \displaystyle V(X)=np(1-p)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-d36042a2e7a181862e9db91fb127df8b_l3.png)
nがある程度大きい時は、中心極限定理によって、は正規分布
に近似できます。これにより、
が二項分布
に従う場合、
を標準化した値
はnが十分に大きいときには標準正規分布
に従います。
![Rendered by QuickLaTeX.com \displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-63e56008dc830776cd77a5cfbc2a4ac3_l3.png)
一方、標本比率 は、
(成功回数を試行回数で割ったもの)から求められます。そこで、上の式の分母と分子をnで割り、
を
おくと、次のように変形できます。
![Rendered by QuickLaTeX.com \displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{\frac{1}{n}}{\frac{1}{n}} \times \frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-238064021f554deaa6c78554de2f5d4a_l3.png)
すなわち、次の式もnが十分に大きいとき標準正規分布に従います。また、
は近似的に正規分布
に従います。
![Rendered by QuickLaTeX.com \displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-63ac0bec215e35e8e9649f213f9779e1_l3.png)
この統計量が標準正規分布
に従うことを利用して、平均値の区間推定と同様に
についての信頼区間を計算できます。
![図1](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/10/795316b92fc766b0181f6fef074f03fa-7.png)
標準正規分布表から読み取ったの95%信頼区間は
であることから、
の式を代入します。
![Rendered by QuickLaTeX.com \displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-63ac0bec215e35e8e9649f213f9779e1_l3.png)
![Rendered by QuickLaTeX.com \displaystyle -1.96 \leq \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq 1.96](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-7b8c0db27451f351d406f69c77b9c3d8_l3.png)
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{p(1-p)}{n}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-22be3ce6982df22979e152cce01654a4_l3.png)
これで母比率についての95%信頼区間を算出するための式が得られました。しかし、この
の信頼区間の不等式の上限値と下限値には母比率
が含まれたままなので、信頼区間を計算できません。ここで、
はpの一致推定量であり、nが大きい時にはほぼ
に一致すると考えられることから、
のpを
で置き換えます。
以上をまとめると、母比率の95%信頼区間は次の式から求められます。
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-277ed9249a3911cd5b2b87a72e5617f3_l3.png)
【まとめ】母比率の信頼区間
抽出したサンプルサイズをn、標本比率を、信頼係数を
とすると、次の式から母比率
の
信頼区間を求めることができる。ただし、
は標準正規分布における上側確率が
となる値(z値)を表す。
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-bd34ad87c43453726ca368af0538e5bb_l3.png)
■おすすめ書籍
近年の統計的検定においては、P値だけでなく「効果量」や「信頼区間」、「検出力」にも着目しようという動きが少しずつ広がってきています。今後このような指標がますます重要になってくるはずです。統計解析を行う方は一度読んでおかれることを強くおすすめします。
21. 母比率の区間推定
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 13. いろいろな確率分布1
13-1. 二項分布
- 13. いろいろな確率分布1
13-2. 二項分布の期待値と分散
- 18. 母平均の点推定
18-3. 推定量の性質
- ブログ
比率が0%のときの信頼区間(3の法則)