BellCurve 統計WEB

未経験からデータ分析が学べる
無料登録してPythonを学ぶ
  • Step1. 基礎編
  • 23. 検定の前に

23-5. 検定統計量と棄却域・採択域


■検定統計量

身長や体重などについて検定を行う場合は、コインの裏表が出る確率とは異なり、取りうる値がどのくらいの確率でその値となるかが分かりません。そこで、身長や体重の値を「検定するための値」に変換します。このようにして算出された値が検定統計量(統計量と呼ばれることもあります)となります。

図1

検定では、データから算出された検定統計量より極端な値をとる確率が有意水準と比較して大きいのか、小さいのかに基づいて帰無仮説を棄却するかどうかを判断します。検定統計量にはいくつかの種類がありますが、ここでは代表的な2つについて説明します。

1. 統計量z(=z値)

平均が0、分散が1となるようにデータを標準化した値のことです。例えば標本平均を標準化した値は次の式から算出できます(\overline{x}:データの平均、\mu:母平均、\sigma^{2}:母分散、n:サンプルサイズ)。分母の\displaystyle \sqrt{\frac{\sigma^{2}}{n}}は標本平均の標準誤差=標本平均の標準偏差を表します。統計量zは標準正規分布に従うため、統計量zを用いた検定を行う際には標準正規分布を使います。

 \displaystyle z=\frac{\overline{x}-\mu}{\sqrt{\frac{\sigma^{2}}{n}}}

2. 統計量t(=t値)

20-1章で既に学びましたが、次の式から算出される値のことです(s^{2}不偏分散)。サンプルサイズがnの場合、統計量tは自由度(n-1)のt分布に従います。そのため、統計量tを用いた検定を行う際には自由度(n-1)のt分布を使います。統計量tを用いた検定のことを「t検定」といいます。t検定は、調べる値の母集団が正規分布することが前提条件となります。

 \displaystyle t=\frac{\overline{x}-\mu}{\sqrt{\frac{s^{2}}{n}}}

例題:

日本人の男性100人をランダムに選び、その身長を測定したところ平均\overline{x}=175、不偏分散s^{2}=100となりました。身長の分布は正規分布に従うとする時、日本人の男性の平均身長は180cmと言ってよいでしょうか。

図2

この場合の帰無仮説H_{0}は「日本人の男性の平均身長は180cmである」、対立仮説H_{1}は「日本人の男性の平均身長は180cmではない」となります。この例題では母分散は分からないので、標本から得られた不偏分散s^{2}を使って統計量tを求めます。

 \displaystyle t=\frac{\overline{x}-\mu}{\sqrt{\frac{s^{2}}{n}}}=\frac{175-180}{\sqrt{\frac{100}{100}}}=-5

この統計量tを用いて検定を行います。有意水準5%で検定する時、統計量tが次の図のt分布の水色部分に入る場合に帰無仮説H_{0}は棄却されます。両端の水色部分の面積は合わせると全体の5%であり、統計量tがこの部分に入るということは5%以下でしか起こらない極めて珍しい事象であると判定されます。

図3

この例題では統計量t=-5となり、この値は上図の左側の水色部分に含まれるため、有意水準5%では帰無仮説H_{0}は棄却され、対立仮説H_{1}が採択されます。つまり、「日本人の男性の平均身長は180cmではない」と結論づけられます。

図4

■棄却域と採択域

上図の例で、水色の部分は帰無仮説H_{0}が棄却される領域であることから「棄却域」と呼ばれます。反対に、白色の部分は帰無仮説H_{0}が棄却されない領域であることから「採択域」と呼ばれます。

図5

■おすすめ書籍

統計を多変量解析も含めて一通り学ぶには最適です。数式を多用していないので読みやすいですし、イラストも多めなので飽きません。実験計画法、ノンパラ、因子分析・主成分分析まで盛り込まれているとても贅沢な1冊です。最大のポイントは、統計手法の説明に我らがエクセル統計を用いている点です!!


23. 検定の前に

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)