BellCurve 統計WEB

  • Step1. 基礎編
  • 21. 母比率の区間推定

21-6. 母比率の差の信頼区間

21-1章および21-2章では母比率の検定方法について学びました。この章では、2つの標本から得た標本比率を使って母比率の差の信頼区間を算出する方法について学びます。

例題:

ある新製品の野菜ジュースについてアンケート調査を行ったところ、女性では200人中80人が、男性では300人中60人が買ってみたいと答えました。この結果から、この野菜ジュースを買ってみたいと答えた割合の差の95%信頼区間はいくらでしょうか。

女性男性
調査人数200300
買ってみたいと答えた人数8060
買ってみたいと答えた割合0.40.2

正規分布の再生性については14-2章で既に学びました。確率変数Xが二項分布B(n, p)に従うとき、nが大きい場合にはXは正規分布N(p, p(1-p))に従うので(21-1章)、これらの和もまた正規分布に従います。

 \displaystyle \widehat{p_1}-\widehat{p_2} \sim N \left( p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}  \right)

したがって、信頼係数(1-\alpha)(=100(1-\alpha)\%)とすると、次の式から母比率の差の(100(1-\alpha)\%)信頼区間を求められます。ただし、1群目の標本比率をp_1、サンプルサイズをn_1、2群目の標本比率をp_2、サンプルサイズp_2をとします。また、\displaystyle z_{\frac{\alpha}{2}}は標準正規分布における上側確率が\displaystyle \frac{\alpha}{2}となる値(z値)を表します。

 \displaystyle (\widehat{p_1}-\widehat{p_2})-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}} \leq p_1-p_2 \leq (\widehat{p_1}-\widehat{p_2})+z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p_1}(1-\widehat{p_1})}{n_1}+\frac{\widehat{p_2}(1-\widehat{p_2})}{n_2}}

問題より、女性ではp_1=0.4n_1=200、男性ではp_2=0.2n_2=300です。したがって、これらを代入すると求める95%信頼区間は、

 \displaystyle (0.4-0.2)-z_{0.025} \times \sqrt{\frac{0.4(1-0.4)}{200}+\frac{0.2(1-0.2)}{300}} \leq p_1-p_2 \leq (0.4-0.2)+z_{0.025} \times \sqrt{\frac{0.4(1-0.4)}{200}+\frac{0.2(1-0.2)}{300}}
 \displaystyle 0.118 \leq p_1-p_2 \leq 0.282

となります。

21. 母比率の区間推定