BellCurve 統計WEB

  • Step1. 初級編
  • 24. 平均値の検定

24-4. 対応のない2標本t検定

例題:

ある学校の1組と2組の算数のテストの平均点を比較します。1組の生徒30人の平均点は75点、標準偏差は5点、2組の生徒32人の平均点は70点、標準偏差は8点でした。この結果から、1組と2組の算数のテストの平均点に差はあると言えるでしょうか。

  1. 仮説を立てる
  2. 帰無仮説H_{0}は「1組と2組の算数のテストの平均点は等しい」とします。したがって、対立仮説H_{1}は「1組と2組の算数のテストの平均点には差がある」となります。

  3. 有意水準を設定する
  4. \alpha=0.05とします。

  5. 適切な検定統計量を決める
  6. この実験では母分散が分からないので、z統計量ではなく不偏分散s^{2}を用いるt統計量を使います。2標本の平均値の差を検定するため、t統計量は次の式から求めます。\overline{x}_{1}は1群目の標本平均、n_{1}は1群目のサンプルサイズ、\overlibe{x}_{2}は2群目の標本平均、n_{2}は2群目のサンプルサイズ、s^{2}はプールした分散を表します。

     \displaystyle t=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{s^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{\overline{x}_{1}-\overline{x}_{2}}{s\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}
  7. 棄却ルールを決める
  8. この検定で使用する分布は自由度「30+32-2=60」の「t分布」になります。また、1組と2組の算数のテストの平均点に差があるかどうかを調べることが目的なので、両側検定を行います。統計数値表からt_{0.025}(60)の値を読み取ると「2.000」となっています。

  9. 検定統計量を元に結論を出す
  10. まず、2つの標本をプールした(まとめた)分散を算出します。

     \displaystyle s^{2}=\frac{(30-1) \times 5^{2}+(32-1) \times 8^{2}}{30+32-2} = 45.15

    この値をt統計量の式に代入すると次のようになります。

     \displaystyle t=\frac{75-70}{\sqrt{45.15 \times \left(\frac{1}{30}+\frac{1}{32}\right)}} \fallingdotseq 2.93

    次の図は自由度60のt分布を表したものです。t=2.93は図の矢印の部分に該当します。矢印は棄却域に入っていることから、「有意水準5%の両側検定において、帰無仮説は棄却され、対立仮説が採択される」という結果になります。つまり、「1組と2組の算数のテストの平均点には差がある」と結論づけられます。

図1

【コラム】母分散が等しいと仮定できる場合とできない場合

この章で説明した対応のない2標本t検定のためのt統計量を求める式は、2標本の母分散が等しいという前提のもとに使います。もし2標本の母分散が等しいと仮定できない場合、「ウェルチのt検定」を使います。そのため、2つの標本の母分散が等しいかどうか分からない場合、等分散性を検定し、その結果を元にどちらの式を使うべきかを判断するようにと多くの書籍に記載されてきました。

ただし近年では、等分散性の検定をせず、はじめから「ウェルチのt検定」を使うケースが増えてきているようです。例えばRを用いて対応のない2標本t検定をおこなった場合、デフォルトで「ウェルチのt検定」の結果が出力されます。また、エクセル統計もデフォルトは「ウェルチのt検定」となっています。

24. 平均値の検定