BellCurve 統計WEB

未経験からデータ分析が学べる
最大55万円の給付金還付
  • Step1. 基礎編
  • 28. 等分散性の検定とWelchのt検定

28-1. F分布


F分布は、自由度k_{1}k_{2}カイ二乗分布\chi_{1}\sim \chi^{2} (k_{1})\chi_{2} \sim \chi^{2} (k_{2})が互いに独立である場合に、次の式から算出されるFが従う確率分布のことです。このときFは自由度(k_{1}, k_{2})のF分布に従います。F分布はt分布やカイ二乗分布と同様、自由度によって形が異なる分布ですが、t分布やカイ二乗分布と異なり2つの自由度から分布の形が決まります。

 \displaystyle F=\frac{\chi_{1}^{2} / k_{1}}{\chi_{2}^{2} / k_{2}}

自由度がk_{1}k_{2}のとき、F分布の確率密度関数は次の式で表すことができます(x > 0)。\Gamma()ガンマ関数B()はベータ関数を表します。F分布の式は非常に複雑ですが、覚える必要はありません。

 \displaystyle f(x;k_{1},k_{2})=\frac{\Gamma(\frac{k_{1}+k_{2}}{2})x^{\frac{k_{1}-2}{2}}}{\Gamma( \frac{k_{1}}{2}) \Gamma(\frac{k_{2}}{2}) (1+\frac{k_{1}}{k_{2}}x)^{\frac{k_{1}+k_{2}}{2}}} \biggl(\frac{k_{1}}{k_{2}} \biggl)^{\frac{k_{1}}{2}}

あるいは

 \displaystyle f(x;k_{1},k_{2})=\frac{1}{B(\frac{k_{1}}{2}, \frac{k_{2}}{2})} \biggl(\frac{k_{1}}{k_{2}} \biggl)^{\frac{k_{1}}{2}} \frac{x^{\frac{k_{1}-2}{2}}}{(1+\frac{k_{1}}{k_{2}}x)^{\frac{k_{1}+k_{2}}{2}}}}

■F分布の実際の使い方

正規分布に従う2つの母集団が従う確率変数N(\mu_{1}, \sigma_{1}^{2})N(\mu_{2}, \sigma_{2}^{2})を考えます。これらの母集団からそれぞれサンプルサイズn_{1}, n_{2}の標本を抽出したときの不偏分散をそれぞれs_{1}^{2}, s_{2}^{2}とします。このときFを求める式には次の関係が成り立ちます。また、Fは自由度(n_{1}-1, n_{2}-1)のF分布に従います。

 \displaystyle F=\frac{\chi_{1}^{2} / k_{1} }{\chi_{2}^{2} / k_{2}}=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}}

2つの母集団の母分散が等しいと仮定できるとき、上の式は

 \displaystyle F=\frac{\chi_{1}^{2}  / k_{1} }{\chi_{2}^{2}  / k_{2}}=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}} = \frac{s_{1}^{2}}{s_{2}^{2}}

となることから、Fは帰無仮説H_{0}を「2標本の母分散は等しい(\sigma_{1}^{2}=\sigma_{2}^{2})」とした場合に、2標本の不偏分散を用いて母分散が等しいかどうかを検定する「等分散性の検定」に使われます。等分散性の検定については28-3章で説明します。

■F分布の形

自由度を変化させた時のF分布の形を見てみます。次のグラフは自由度(k_{1}, k_{2})(グラフ中ではdfで表示しています)が(1, 5)、(2, 5)、(3, 5)、(10, 5)、(10, 20)である場合のF分布(黒、赤、緑、青、水色、ピンク線)です。

図1

■F分布の性質

  1. 期待値と分散

    確率変数Xが自由度(m, n)のF分布に従っている時、Xの期待値E(X)と分散V(X)は次のようになります。

     \displaystyle E(X)=\frac{n}{n-2}~~~~(n>2)
     \displaystyle V(X)=\frac{2n^{2} (m+n-2)}{m(n-2)^{2} (n-4)}~~~~(n>4)
  2. t分布とF分布の関係

    標準正規分布N(0, 1)に従うZと自由度nのカイ二乗分布Wがあり、これらが互いに独立であるとき、次の式から算出されるtは自由度nのt分布に従います(20-1章)。

     \displaystyle t=\frac{Z}{\sqrt{\frac{W}{n}}}
    上式の両辺を2乗すると、
     \displaystyle t^2=\frac{Z^2}{\frac{W}{n}}
    となりますが、自由度1のカイ二乗分布は標準正規分布に従う確率変数を2乗したものに等しくなるので(22-1章)、tが自由度のnのt分布に従うとき、t^2は自由度(1, n)のF分布に従います。

■おすすめ書籍

医学統計で使われる様々な手法をイラストによるイメージから理解することができます。イラストが凄く可愛らしいのと、世界観が面白いので個人的にお気に入りの1冊です。


28. 等分散性の検定とWelchのt検定

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【エクセル統計/新規ユーザー】春の年度末SALE!
【エクセル統計/新規ユーザー】春の年度末SALE!

【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)