BellCurve 統計WEB

  • Step1. 初級編
  • 24. 平均値の検定

24-3. 2標本t検定とは

2つの独立した母集団があり、それぞれの母集団から抽出した標本の平均に差があるかどうかを検定することを「2標本t検定」といいます。例えば、ある学校で行ったテストの点数が1組と2組とで差があるかどうかの検定や、被験者に対してある薬を投与する前後で血圧がどう変化したかの検定に使います。ただし、2つのデータが「対応のあるデータ」か「対応のないデータ」かによって検定統計量の算出方法が異なります。

図1

■対応がない場合の2標本t検定の方法

異なる対象から抽出された2つの標本は「対応のないデータ(対応なし)」です。 例えば、1組と2組の生徒は異なるので、それぞれのクラスから抽出された2つの標本は「対応のないデータ」となります。

図3

対応がない場合の2標本t検定では、2つの標本に対応がないことを加味した検定統計量を用いる必要があります。母分散が分からない場合、1群目の標本平均を\overline{x}_{1}サンプルサイズn_{1}、2群目の標本平均を\overline{x}_{2}、サンプルサイズをn_{2}としたときに、次の式から算出される統計量tを使います。検定で用いるのは自由度(n_{1}+n_{2}-2)のt分布です。

 \displaystyle t=\frac{\overline{x}_{1}-\overline{x}_{2}}{\sqrt{s^{2}\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right)}}=\frac{\overline{x}_{1}-\overline{x}_{2}}{s\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}

ただし、この式には2つの標本の不偏分散を用いて算出した「プールした分散s^{2}」を使っています。プールした分散とは、2つの標本の不偏分散を1つにまとめたもので、1群目の不偏分散をs_{1}^{2}、2群目の不偏分散をs_{2}^{2}とした場合、下の式から求めることができます。

 \displaystyle s^{2}=\frac{(n_{1}-1) \times {s_{1}}^{2}+(n_{2}-1) \times {s_{2}}^{2}}{n_{1}+n_{2}-2}

■対応がある場合の2標本t検定の方法

一方、同一の対象から抽出された「対」となる2つの標本は「対応のあるデータ(対応あり)」です。例えば、数人の被験者に対して投薬実験を行った場合に、投薬前後で得られる同一被験者由来の対となる標本は「対応のあるデータ」となります。

図4

対応がある場合の2標本t検定では、「対応のあるデータの差」を用いて検定を行います。差を用いると実質は1標本の検定となるので、「24-1. 母平均の検定(両側t検定)」や「24-2. 母平均の検定(片側t検定)」と同様のやり方で行います。帰無仮説H_{0}は「対応のあるデータの差の平均は0である」となります。

■おすすめ書籍

満を持して登場の通称”赤本”です。統計検定2級対策本として様々なところで紹介されているのを目にしたことがある方も多いかもしれません。統計学基礎の内容がしっかりまとまっている1冊である反面、やや難しいです。初学者の方が一番初めに手に取る本としてはあまりおすすめできませんが、勉強を進めていくと理解できるページが増えてきて、統計の知識が盤石なものになっていくのではないかと思います。





24. 平均値の検定

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。