Step1. 基礎編
21. 母比率の区間推定

21-1. 母比率の信頼区間の求め方1

母平均の推定と同じように、母比率についても区間推定を行うことができます。成功確率が $p$ である試行をn回行うときに成功する回数を $X$ とすると、 $X$ は二項分布 $B(n,p)$ に従うことは13-1章で既に学びました。この $p$ が母比率に対応します。

また、二項分布に従う確率変数 $X$ の期待値と分散はそれぞれ次のようになることは13-2章で既に学びました。

$\displaystyle E(X)=np$

$\displaystyle V(X)=np(1-p)$

nがある程度大きい時は、中心極限定理によって、 $B(n,p)$ は正規分布 $N(np, np(1-p))$ に近似できます。これにより、 $X$ が二項分布 $B(n,p)$ に従う場合、 $X$ を標準化した値 $Z$ はnが十分に大きいときには標準正規分布 $N(0, 1)$ に従います。

$\displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}$

一方、標本比率 $\widehat{p}$ は、 $\widehat{p}=\displaystyle \frac{X}{n}$ （成功回数を試行回数で割ったもの）から求められます。そこで、上の式の分母と分子をnで割り、 $\displaystyle \frac{X}{n}$ を $\widehat{p}$ おくと、次のように変形できます。

$\displaystyle Z=\frac{X-np}{\sqrt{np(1-p)}}=\frac{\frac{1}{n}}{\frac{1}{n}} \times \frac{X-np}{\sqrt{np(1-p)}} = \frac{\frac{X}{n}-p}{\sqrt{\frac{p(1-p)}{n}}} = \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$

すなわち、次の式もnが十分に大きいとき標準正規分布 $N(0,1)$ に従います。また、 $\widehat{p}$ は近似的に正規分布 $N(p, \frac{p(1-p)}{n}})$ に従います。

$\displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$

この統計量 $Z$ が標準正規分布 $N(0,1)$ に従うことを利用して、平均値の区間推定と同様に $Z$ についての信頼区間を計算できます。

標準正規分布表から読み取った $Z$ の95%信頼区間は $-1.96 \leq Z \leq 1.96$ であることから、 $Z$ の式を代入します。

$\displaystyle Z=\frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}}$

$\displaystyle -1.96 \leq \frac{\widehat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq 1.96$

$\displaystyle \widehat{p}-1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{p(1-p)}{n}}$

これで母比率 $p$ についての95%信頼区間を算出するための式が得られました。しかし、この $p$ の信頼区間の不等式の上限値と下限値には母比率 $p$ が含まれたままなので、信頼区間を計算できません。ここで、 $\widehat{p}$ はpの一致推定量であり、nが大きい時にはほぼ $p$ に一致すると考えられることから、 $\sqrt{\frac{p(1-p)}{n}}$ のpを $\widehat{p}$ で置き換えます。

以上をまとめると、母比率 $p$ の95％信頼区間は次の式から求められます。

$\displaystyle \widehat{p}-1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + 1.96 \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}$

【まとめ】母比率の信頼区間

抽出したサンプルサイズをn、標本比率を $\widehat{p}$ 、信頼係数を $(1-\alpha)(=100(1-\alpha)\%)$ とすると、次の式から母比率 $p$ の $(100(1-\alpha)\%)$ 信頼区間を求めることができる。ただし、 $\displaystyle z_{\frac{\alpha}{2}}$ は標準正規分布における上側確率が $\displaystyle \frac{\alpha}{2}$ となる値（z値）を表す。

$\displaystyle \widehat{p}-z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}} \leq p \leq \widehat{p} + z_{\frac{\alpha}{2}} \times \sqrt{\frac{\widehat{p}(1-\widehat{p})}{n}}$