- Step1. 基礎編
- 21. 母比率の区間推定
21-4. 必要なサンプルサイズ1
母比率の95%信頼区間は次の式から求められることは21-1章で既に学びました。
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}-1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-4077226dba6957f45acdd2142b4939a2_l3.png)
母比率の95%信頼区間は、標本比率
の両側に
ずつ幅を取ったものであると考えることができます。つまり、95%信頼区間の幅は次のようになります。この式を使うと、必要なサンプルサイズを算出できます。
![図1](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/10/795316b92fc766b0181f6fef074f03fa-10.png)
例題:
テレビ番組の視聴に関する街頭アンケートを行います。信頼係数を95%とし、A番組の視聴率の信頼区間の幅を5%以下にするためには、何人以上の人にアンケートを行わなくてはならないでしょうか。ただし、A番組の視聴率は事前調査により10%以下であることが分かっているものとします。
A番組の視聴率の推定値=0.1を①の式に代入し、nを求めます。①式が5%(=0.05)以下であればいいので、次の関係が成り立ちます。
![Rendered by QuickLaTeX.com \displaystyle 2 \times 1.96 \times \sqrt{\frac{0.1(1-0.1)}{n}} \leq 0.05](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-30123cd2d20e01fc40c08b9d764189d2_l3.png)
![Rendered by QuickLaTeX.com \displaystyle 2 \times 1.96 \times \sqrt{\frac{0.09}{n}} \leq 0.05](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-3cfda050be8bfe170d6d1c263c128dc7_l3.png)
![Rendered by QuickLaTeX.com \displaystyle \sqrt{n} \geq 2 \times 1.96 \times \sqrt{0.09} \times \frac{1}{0.05}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-216442e4c42302926c4cccdd57a24cb9_l3.png)
![Rendered by QuickLaTeX.com \displaystyle \sqrt{n} \geq 23.52](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-05c0cda55986da070828dd8ea5fe3265_l3.png)
![Rendered by QuickLaTeX.com \displaystyle n \geq 23.52^{2}=553.2](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-4113f473109350ecbe728c98bca80ac9_l3.png)
したがって、554人以上の人に対してアンケートを行えばよいという結果になりました。①の式を一般化して信頼係数(=100
%)の場合には、正規分布の累積確率を用いて次のように表せます。
![Rendered by QuickLaTeX.com \displaystyle 2 \times z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-0c24bfe3c2bb6e6f3e3b1ee0b44be586_l3.png)
この式から、母比率の信頼区間について次の3点が成り立つことが分かります。
- nが大きくなると信頼区間の幅は狭くなり、より正確な推定ができる
が0.5のとき、最も信頼区間が広くなり、0.5から外れるごとに信頼区間は狭くなる
- 信頼区間の幅は
に比例する
信頼区間の長さがに反比例しているためです。例えば、nが4倍になると信頼区間の幅は半分になります。
の部分が、
=0.5のとき最大値を取るためです。
※ただし、「信頼区間の幅が±x%以下となるために必要なサンプルサイズ」もしくは「標本誤差をx%以内にするために必要なサンプルサイズ」を求める場合には、
![Rendered by QuickLaTeX.com \displaystyle z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq \frac{x}{100}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-0c8a249295e02151b07d729762c4cc06_l3.png)
という式を立てて計算する必要があります(「2×」の部分は不要)。
■Tips 母比率の区間推定における必要なサンプルサイズの計算フォーム
こちらのページでは、母比率の区間推定における必要サンプルサイズを自動で計算できます。上で挙げた例題の場合、「誤差:2.5%(標本比率が母比率に対して上下2.5%の範囲内に収まって欲しい=信頼区間を5%以内にする)」、「信頼度:95%」、「母比率:10%」を入力することで、必要サンプルサイズ「554」が算出されます。
の値は信頼係数が高くなるほど大きくなるので、例えば95%信頼区間よりも99%信頼区間の方が信頼区間の幅が広くなります。
■おすすめ書籍
サンプルサイズの計算について網羅的に書かれた(おそらく)唯一の本です。が、結構難しいです…。
21. 母比率の区間推定
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 統計Tips
母比率の区間推定(無限母集団)
- 21. 母比率の区間推定
21-1. 母比率の信頼区間の求め方1
- ブログ
sample, population, universe
- ブログ
幾つデータが必要か?