正規分布、カイ二乗分布、t分布、F分布
2017/08/14
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※
この4つの分布は統計学において頻繁に利用されますが、4つの分布の間には以下のような関連があります。
まず、自由度 n のカイ二乗(c2)分布は、n 個の独立な(変数間に相関がない)標準正規分布に従う変数 z を二乗して加え合わせたものです。式にすると次の通りになります。
カイ二乗分布は二乗値を合わせたものですから、マイナスになることはありません。自由度nが大きくなれば、平均が n 、分散が 2n の正規分布に近づいていくことが保証されています。
t 分布や F 分布は、カイ二乗分布をその自由度で割った分布、修正カイ二乗分布をベースにして定義されます。自由度 r の修正カイ二乗分布に従う変数 Cr2 は、次の式の通りです。
この式により、自由度1の修正カイ二乗分布は、自由度1のカイ二乗分布に等しいことが分かります。また、Cr2 の二乗根 Cr は修正カイ変数と呼ばれます。
自由度 r のスチューデントの t 分布に従う変数 t r は、標準正規分布に従う変数zを修正カイ変数 C r で割ったものです。
自由度が m と n の F 分布に従う変数 F m,nは、自由度が m と n の2つの修正カイ二乗変数 Cm2 、 Cn2 の比です。
ここで、片方の自由度 m が 1 の F 分布を考えてみましょう。自由度 1 の修正カイ二乗分布は自由度 1 のカイ二乗分布に等しくなりますから、F1,n は次のようになります。
さらに、自由度 n の t 分布の二乗に従う t n2 を考えてみます。
自由度 1 のカイ二乗分布は標準正規分布の二乗ですから、F1,n と t n2 は同じ分布になることがわかります。つまり、t 値を二乗してやれば F 値になるということです。対応のない2群の平均値の差の両側検定(いわゆる t 検定のことです)の p 値と、2水準の一元配置分散分析の p 値が一致するのはこのような理由によります。
追記
t検定やカイ二乗検定を調べていてこのページに辿り着かれた方は、次のコラムを参照ください。
t検定について
ブログ 「平均値の差の検定 ―t検定、分散分析、重回帰分析」
カイ二乗検定について
ブログ 「独立性の検定 ―最もポピュラーなカイ二乗検定」