BellCurve 統計WEB

未経験からデータ分析が学べる
卒業後の追加講座も永年見放題
  • Step1. 基礎編
  • 21. 母比率の区間推定

21-1. 母比率の信頼区間の求め方1


母平均の推定と同じように、母比率についても区間推定を行うことができます。成功確率がpである試行をn回行うときに成功する回数をXとすると、X二項分布B(n,p)に従うことは13-1章で既に学びました。このpが母比率に対応します。

また、二項分布に従う確率変数X期待値と分散はそれぞれ次のようになることは13-2章で既に学びました。

 \displaystyle E(X)=np
 \displaystyle V(X)=np(1-p)

nがある程度大きい時は、中心極限定理によって、B(n,p)正規分布N(np, np(1-p))に近似できます。これにより、Xが二項分布B(n,p)に従う場合、X標準化した値Zはnが十分に大きいときには標準正規分布N(0, 1)に従います。

 \displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}

一方、標本比率 \widehat{p} は、\widehat{p}=\displaystyle \frac{X}{n}(成功回数を試行回数で割ったもの)から求められます。そこで、上の式の分母と分子をnで割り、\displaystyle \frac{X}{n}\widehat{p}おくと、次のように変形できます。

 \displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{\frac{1}{n}}{\frac{1}{n}} \times \frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}

すなわち、次の式もnが十分に大きいとき標準正規分布N(0,1)に従います。また、\widehat{p}は近似的に正規分布N(p, \frac{p(1-p)}{n}})に従います。

 \displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}

この統計量Zが標準正規分布N(0,1)に従うことを利用して、平均値の区間推定と同様にZについての信頼区間を計算できます。

図1

標準正規分布表から読み取ったZの95%信頼区間は-1.96 \leq Z \leq 1.96であることから、Zの式を代入します。

 \displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}
 \displaystyle -1.96 \leq \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq 1.96
 \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{p(1-p)}{n}}

これで母比率pについての95%信頼区間を算出するための式が得られました。しかし、このpの信頼区間の不等式の上限値と下限値には母比率pが含まれたままなので、信頼区間を計算できません。ここで、\widehat{p}はpの一致推定量であり、nが大きい時にはほぼpに一致すると考えられることから、\sqrt{\frac{p(1-p)}{n}}のpを\widehat{p}で置き換えます。

以上をまとめると、母比率pの95%信頼区間は次の式から求められます。

 \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

【まとめ】母比率の信頼区間

抽出したサンプルサイズをn、標本比率を\widehat{p}信頼係数(1-\alpha)(=100(1-\alpha)\%)とすると、次の式から母比率p(100(1-\alpha)\%)信頼区間を求めることができる。ただし、\displaystyle z_{\frac{\alpha}{2}}は標準正規分布における上側確率が\displaystyle \frac{\alpha}{2}となる値(z値)を表す。

 \displaystyle \widehat{p}-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

■おすすめ書籍

近年の統計的検定においては、P値だけでなく「効果量」や「信頼区間」、「検出力」にも着目しようという動きが少しずつ広がってきています。今後このような指標がますます重要になってくるはずです。統計解析を行う方は一度読んでおかれることを強くおすすめします。


21. 母比率の区間推定

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【エクセル統計/新規ユーザー】春の年度末SALE!
【エクセル統計/新規ユーザー】春の年度末SALE!

【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)