BellCurve 統計WEB

無料登録してPythonを学ぶ
未経験からデータ分析が学べる
  • Step1. 基礎編
  • 25. さまざまな検定

25-2. 二項分布を用いた検定


25-1章の母比率の検定と同じ問題について、この章では二項分布を用いた検定を行ってみます。

例題:

あるサイコロを12,000回投げたときに1が2,200回出ました。このサイコロはどの目も等しく出る歪みのないサイコロといえるでしょうか。

図1

サイコロを投げて1が出るか、出ないかという試行は2種類の結果しか得られないので、サイコロをn回投げたときに1の目が出る回数xは二項分布に従います。

  1. 仮説を立てる
  2. 帰無仮説H_{0}は「このサイコロを12,000回振ったときに1が出るのは2,000回(=12,000/6)である」とします。したがって、対立仮説H_{1}は「このサイコロを12,000回投げたときに1が出るのは2,000回ではない」となります。

  3. 有意水準を設定する
  4. \alpha=0.05とします。

  5. 適切な検定統計量を決める
  6. 二項分布Bi(n, p)の場合、Xを確率変数とすると「期待値E(X)=np、分散V(X)=np(1-p)」が成り立つことは13-2章で既に学びました。したがって、サンプルサイズnが十分に大きい時には、次の式から得られる統計量zは標準正規分布N(0, 1)に従います。ここではXは1が出た回数、pは成功確率(=1が出る確率)、nは試行回数を表します。

     \displaystyle z=\frac{X-np}{\sqrt{np(1-p)}}
  7. 棄却ルールを決める
  8. この検定で使用する分布は「標準正規分布」になります。また、サイコロの1の目の出方に歪みがないかどうかを確認したいので、両側検定を行います。統計数値表からZ_{0.025}の値を読み取ると「1.96」となっています。

  9. 検定統計量を元に結論を出す
  10. 試行回数はn=12,000、1が出る確率はp=1/6なので統計量zは次のようになります。

     \displaystyle z=\frac{2200-2000}{\sqrt{12000 \times \frac{1}{6}  \times (1-\frac{1}{6})}} \fallingdotseq 4.899

    次の図は標準正規分布を表したものです。z=4.899は図の矢印の部分に該当します。矢印は棄却域に入っていることから、「有意水準5%において帰無仮説を棄却し、対立仮説を採択する」という結果になります。つまり「このサイコロの1が出る確率は1/6ではない、すなわちこのサイコロは1の出やすさに関して歪んでいる」と結論づけられます。

図2


■連続修正

二項分布は離散型確率分布であり、確率変数が取りうる値がとびとびの値です。そのため、連続型確率分布である正規分布に近似しようとすると、誤差が出てしまいます。

例えば、二項分布において確率変数Xが取りうる値がX\geq1およびX\geq2となる確率を考えてみます。これらの確率P(X\geq1)P(X\geq2)を、二項分布を用いて正規近似により求めようとするとXが1と2の間の値を取る場合の確率はP(X\geq1)にはすべて含まれるものの、P(X\geq2)には全く含まれないことが分かります。

これを補正するために行うのが「連続修正」です。具体的にはX\geq1X\geq1.5X\geq2X\geq2.5というように、0.5を使って補正を行います。すなわち、

 P(X \leq x) \approx P(Y<x+0.5) \\ P(X \geq x) \approx P(Y>x-0.5) \\

を使って正規近似を行います。(Yは正規分布に従う確率変数を表します)


25. さまざまな検定

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)