BellCurve 統計WEB

  • Step1. 初級編
  • 21. 母比率の区間推定

21-5. 必要なサンプルサイズ2

例題:

ある比率を調査し、95%信頼区間を推定します。信頼区間の幅を4%に収めたい場合、どの程度のサンプルサイズを確保すればよいでしょうか。

母比率pの信頼区間の幅は次の式で計算できることは既に学びました。

 \displaystyle 2 \times z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

この値が4%(=0.04)以下であればいいので、次の関係が成り立てばよいわけです。

 \displaystyle 2 \times z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq 0.04

95%信頼区間の場合の\displaystyle z_{\frac{1-\alpha}{2}}は1.96ですが、標本比率\widehat{p}の値は分かりません。このような場合、信頼区間の幅が最も大きくなるのは\widehat{p}=0.5の場合です。\widehat{p}=0.5の場合について考えておけば、実際の標本比率\widehat{p}がどのような数値であったとしても、それより信頼区間の幅が大きくなることはないことから\widehat{p}=0.5を使います。したがって\widehat{p}=0.5を代入すると、

 \displaystyle 2 \times 1.96 \times \sqrt{\frac{0.5(1-0.5)}{n}} \leq 0.04
 \displaystyle 2 \times 1.96 \times \frac{\sqrt{0.25}}{\sqrt{n}} \leq 0.04
 \displaystyle \sqrt{n} \geq 2 \times 1.96 \times \sqrt{0.25} \times \frac{1}{0.04}
 \displaystyle \sqrt{n} \geq 49
 \displaystyle n \geq 49^{2}=2401

つまり、サンプルサイズを2401以上確保すればよいということが分かります。標本比率が分かっていない場合は、このように信頼区間の幅が最も大きくなる\widehat{p}=0.5として計算をします。一方、事前の調査などで標本比率\widehat{p}の値が分かっている場合は、その数値を代入することで無駄に大きなサンプルサイズを確保する必要がなくなります。

【コラム】\widehat{p}=0.5ではない場合の必要サンプルサイズ

\widehat{p}が0.5ではない場合の、95%信頼区間の幅を4%に収めるための必要サンプルサイズは次のようになります。

標本比率p ̂必要サンプルサイズn
0n \geq 0
0.1n \geq 864.4
0.3n \geq 2016.8
0.7n \geq 2016.8
0.99n \geq 95.1

21. 母比率の区間推定