BellCurve 統計WEB

  • Step1. 初級編
  • 21. 母比率の区間推定

21-1. 母比率の信頼区間の求め方1

母平均の推定と同じように、母比率についても区間推定を行うことができます。成功確率がpである試行をn回行うときに成功する回数をXとすると、X二項分布B(n,p)に従うことは13-1章で既に学びました。このpが母比率に対応します。

また、二項分布に従う確率変数X期待値と分散はそれぞれ次のようになることは13-2章で既に学びました。

 \displaystyle E(X)=np
 \displaystyle V(X)=np(1-p)

nがある程度大きい時は、中心極限定理によって、B(n,p)正規分布N(np, np(1-p))に近似できます。これにより、Xが二項分布B(n,p)に従う場合、X標準化した値Zはnが十分に大きいときにはZ標準正規分布N(0, 1)に従います。

 \displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}

一方、標本比率 \widehat{p} は、\widehat{p}=\displaystyle \frac{X}{n}(成功回数を試行回数で割ったもの)から求められます。そこで、上の式の分母と分子をnで割り、\displaystyle \frac{X}{n}\widehat{p}おくと、次のように変形できます。

 \displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{\frac{1}{n}}{\frac{1}{n}} \times \frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}

すなわち、次の式もnが十分に大きいとき標準正規分布N(0,1)に従います。

 \displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}

この統計量Zが標準正規分布N(0,1)に従うことを利用して、平均値の区間推定と同様にZについての信頼区間を計算できます。

図1

標準正規分布表から読み取ったZの95%信頼区間は-1.96 \leq Z \leq 1.96であることから、Zの式を代入します。

 \displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}
 \displaystyle -1.96 \leq \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq 1.96
 \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{p(1-p)}{n}}

これで母比率pについての95%信頼区間を算出するための式が得られました。しかし、このpの信頼区間の不等式の上限値と下限値には母比率pが含まれたままなので、信頼区間を計算できません。ここで、\widehat{p}はpの一致推定量であり、nが大きい時にはほぼpに一致すると考えられることから、\sqrt{\frac{p(1-p)}{n}}のpを\widehat{p}で置き換えます。

以上をまとめると、母比率pの95%信頼区間は次の式から求められます。

 \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

【まとめ】母比率の信頼区間

抽出したサンプルサイズをn、標本比率を\widehat{p}信頼係数(1-\alpha)(=100(1-\alpha)\%)とすると、次の式から母平均\mu(100(1-\alpha)\%)信頼区間を求めることができる。ただし、\displaystyle z_{\frac{\alpha}{2}}は標準正規分布における上側確率が\displaystyle \frac{\alpha}{2}となる値(z値)を表す。

 \displaystyle \widehat{p}-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

21. 母比率の区間推定

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。