BellCurve 統計WEB

  • Step1. 初級編
  • 21. 母比率の区間推定

21-4. 必要なサンプルサイズ1

母比率pの95%信頼区間は次の式から求められることは21-1章で既に学びました。

 \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

母比率pの95%信頼区間は、標本比率\widehat{p}の両側に\displaystyle 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}ずつ幅を取ったものであると考えることができます。つまり、95%信頼区間の幅は次のようになります。この式を使うと、必要なサンプルサイズを算出できます。

図1

例題:

テレビ番組の視聴に関する街頭アンケートを行います。信頼係数を95%とし、A番組を見ている人の信頼区間を5%以下にするためには、何人以上の人にアンケートを行わなくてはならないでしょうか。ただし、A番組の視聴率は事前調査により10%であることが分かっているものとします。

A番組の視聴率の推定値\widehat{p}=0.1を①の式に代入し、nを求めます。①式が5%(=0.05)以下であればいいので、次の関係が成り立ちます。

 \displaystyle 2 \times 1.96 \times \sqrt{\frac{0.1(1-0.1)}{n}} \leq 0.05
 \displaystyle 2 \times 1.96 \times \sqrt{\frac{0.09}{n}} \leq 0.05
 \displaystyle \sqrt{n} \geq 2 \times 1.96 \times \sqrt{0.09} \times \frac{1}{0.05}
 \displaystyle \sqrt{n} \geq 23.52
 \displaystyle n \geq 23.52^{2}=553.2

したがって、554人以上の人に対してアンケートを行えばよいという結果になりました。①の式を一般化して信頼係数\alpha(=100\alpha%)の場合には、正規分布の累積確率を用いて次のように表せます。

 \displaystyle 2 \times z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}

この式から、母比率の信頼区間について次の3点が成り立つことが分かります。

  1. nが大きくなると信頼区間の幅は狭くなり、より正確な推定ができる
  2. 信頼区間の長さが\sqrt{n}に反比例しているためです。例えば、nが4倍になると信頼区間の幅は半分になります。

  3. \widehat{p}が0.5のとき、最も信頼区間が広くなり、0.5から外れるごとに信頼区間は狭くなる
  4. \widehat{p}(1-\widehat{p})の部分が、\widehat{p}=0.5のとき最大値を取るためです。

  5. 信頼区間の幅は\displaystyle z_{\frac{1-\alpha}{2}}に比例する
  6. \displaystyle z_{\frac{1-\alpha}{2}}の値は信頼係数が高くなるほど大きくなるので、例えば95%信頼区間よりも99%信頼区間の方が信頼区間の幅が広くなります。

    ■おすすめ書籍

    サンプルサイズの計算について網羅的に書かれた(おそらく)唯一の本です。が、結構難しいです…。

    
    
    
    
    
    

21. 母比率の区間推定

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。