- Step1. 基礎編
- 25. さまざまな検定
25-7. 母比率の差の検定
25-1章では母比率の検定方法について学びました。この章では、2つの標本から得た標本比率を使って母比率が等しいかを検定する方法について学びます。
例題:
あるドラマの視聴率を調査したところ、関東地区では5,000世帯中1,000世帯が視聴していたことが分りました。一方、関西地区では3,000世帯中540世帯が視聴していました。この結果から、2地区の視聴率に差があるといえるでしょうか。
関東地区 | 関西地区 | |
---|---|---|
調査世帯数 | 5000 | 3000 |
視聴世帯数 | 1000 | 540 |
- 仮説を立てる
- 有意水準を設定する
- 適切な検定統計量を決める
- 棄却ルールを決める
- 検定統計量を元に結論を出す
帰無仮説は「関東地区と関西地区の視聴率は等しい」とします。したがって、対立仮説
は「関東地区と関西地区の視聴率は等しくない(差がある)」となります。
とします。
母比率の差の検定では、サンプルサイズnが十分に大きい時には、次の式から得られる統計量zは標準正規分布に従います。1群目の標本比率を
、サンプルサイズを
、2群目の標本比率を
、サンプルサイズを
とします。また、この式では2つの標本比率を1つにまとめた標本比率(プールした標本比率)
を使います。
![Rendered by QuickLaTeX.com \displaystyle z=\frac{\widehat{p}_{1}-\widehat{p}_{2}}{\sqrt{\widehat{p}(1-\widehat{p}) \left(\frac{1}{n_1}+\frac{1}{n_2} \right)}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c6fe32518a04e8d14739e6692ec6e88b_l3.png)
プールした標本比率は次の式から求めます。
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}=\frac{n_1\widehat{p}_1+n_2\widehat{p}_2}{n_1+n_2}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c9667229eede461240c2cc3df2026b6d_l3.png)
この検定で使用する分布は「標準正規分布」になります。また、関東地区と関西地区とで視聴率に差があるかどうかを確認したいので、両側検定を行います。統計数値表からの値を読み取ると「1.96」となっています。
調査結果から標本比率、
、プールした標本比率
は次のようになります。
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}_{1} = \frac{1000}{5000} = 0.2](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-62b0f1cd49e7bec9bc3458ac29fc3f41_l3.png)
![Rendered by QuickLaTeX.com \displaystyle \widehat{p}_{2} = \frac{540}{3000} = 0.18](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-1edfc10935f92201882cad13ac3e690c_l3.png)
![Rendered by QuickLaTeX.com \displaystyle \widehat{p} = \frac{5000 \times 0.2 + 3000 \times 0.18}{5000+3000} = \frac{1000+540}{8000} = 0.1925](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-efd974358058675552e7e56535f9340e_l3.png)
これらの標本比率とサンプルサイズを用いて統計量zを求めます。
![Rendered by QuickLaTeX.com \displaystyle z=\frac{0.2-0.18}{\sqrt{0.1925(1-0.1925) \left(\frac{1}{5000}+\frac{1}{3000} \right)}}=2.197](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-7f224bb040c7d941cee97800dceb4d3f_l3.png)
次の図は標準正規分布を表したものです。z=2.197は図の矢印の部分に該当します。矢印は棄却域に入っていることから、「有意水準5%において、帰無仮説を棄却し、対立仮説
を採択する」という結果になります。つまり「関東地区と関西地区とで視聴率に差がある」と結論づけられます。
【コラム】母比率の差の検定と正規分布の再生性
正規分布の再生性については14-2章で既に学びました。確率変数が二項分布
に従うとき、
が大きい場合には
は正規分布
に従うので(21-1章)、これらの和(差)もまた正規分布に従います。
![Rendered by QuickLaTeX.com \displaystyle \widehat{p_1}-\widehat{p_2} \sim N \left( p_1-p_2, \frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-d832efe5c0b9a6e08ac12a88dddda893_l3.png)
を正規化した
は正規分布に従います。
![Rendered by QuickLaTeX.com \displaystyle z=\frac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\sqrt{\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}}} \sim N(0, 1)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-34931e00e2041cbf9a0df38b5a956a62_l3.png)
この母比率の差の検定は、帰無仮説を
としていることから、
としたときの
と
をプールした標本比率
を使って、次のように書き換えられます。
![Rendered by QuickLaTeX.com \displaystyle z=\frac{(\widehat{p_1}-\widehat{p_2})-(p_1-p_2)}{\sqrt{\frac{\widehat{p}(1-\widehat{p})}{n_1}+\frac{\widehat{p}(1-\widehat{p})}{n_2}}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-ce6943ee04afcad926770b6f0fcc9841_l3.png)
したがって、
![Rendered by QuickLaTeX.com \displaystyle z=\frac{\widehat{p}_{1}-\widehat{p}_{2}}{\sqrt{\widehat{p}(1-\widehat{p}) \left(\frac{1}{n_1}+\frac{1}{n_2} \right)}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c6fe32518a04e8d14739e6692ec6e88b_l3.png)
となります。
25. さまざまな検定
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 21. 母比率の区間推定
21-1. 母比率の信頼区間の求め方1
- 21. 母比率の区間推定
21-2. 母比率の信頼区間の求め方2
- 25. さまざまな検定
25-1. 母比率の検定
- 統計Tips
2群の母比率の差の検定
- ブログ
割合と比率
- ブログ
二項検定
- ブログ
2群の比率の差の検定
- ブログ
幾つデータが必要か? - 比率の差の検定