BellCurve 統計WEB

  • Step1. 初級編
  • 28. 等分散性の検定とWelchのt検定

28-1. F分布

F分布は、自由度k_{1}k_{2}カイ二乗分布\chi_{1}\sim \chi^{2} (k_{1})\chi_{2} \sim \chi^{2} (k_{2})が互いに独立である場合に、次の式から算出されるFが従う確率分布のことです。このときFは自由度(k_{1}, k_{2})のF分布に従います。F分布はt分布やカイ二乗分布と同様、自由度によって形が異なる分布ですが、t分布やカイ二乗分布と異なり2つの自由度から分布の形が決まります。

 \displaystyle F=\frac{\chi_{1}^{2} / k_{1}}{\chi_{2}^{2} / k_{2}}

自由度がk_{1}k_{2}のとき、F分布の確率密度関数は次の式で表すことができます(x > 0)。\Gamma()ガンマ関数B()はベータ分布を表します。F分布の式は非常に複雑ですが、覚える必要はありません。

 \displaystyle f(x;k_{1},k_{2})=\frac{\Gamma(\frac{n_{1}+n_{2}}{2})x^{\frac{n_{1}-2}{2}}}{\Gamma( \frac{n_{1}}{2}) \Gamma(\frac{n_{2}}{2}) (1+\frac{n_{1}}{n_{2}}x)^{\frac{n_{1}+n_{2}}{2}}} \biggl(\frac{n_{1}}{n_{2}} \biggl)^{\frac{n_{1}}{2}}

あるいは

 \displaystyle f(x;k_{1},k_{2})=\frac{1}{B(\frac{n_{1}}{2}, \frac{n_{2}}{2})} \biggl(\frac{n_{1}}{n_{2}} \biggl)^{\frac{n_{1}}{2}} \frac{x^{\frac{n_{1}-2}{2}}}{(1+\frac{n_{1}}{n_{2}}x)^{\frac{n_{1}+n_{2}}{2}}}}

■F分布の実際の使い方

正規分布に従う2つの母集団が従う確率変数N(\mu_{1}, \sigma_{1}^{2})N(\mu_{2}, \sigma_{2}^{2})を考えます。これらの母集団からそれぞれサンプルサイズn_{1}, n_{2}の標本を抽出したときの不偏分散をそれぞれs_{1}^{2}, s_{2}^{2}とします。このときFを求める式には次の関係が成り立ちます。また、Fは自由度(n_{1}-1, n_{2}-1)のF分布に従います。

 \displaystyle F=\frac{\chi_{1}^{2} / k_{1} }{\chi_{2}^{2} / k_{2}}=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}}

2つの母集団の母分散が等しいと仮定できるとき、上の式は

 \displaystyle F=\frac{\chi_{1}^{2}  / k_{1} }{\chi_{2}^{2}  / k_{2}}=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}} = \frac{s_{1}^{2}}{s_{2}^{2}}

となることから、Fは帰無仮説H_{0}を「2標本の母分散は等しい(\sigma_{1}^{2}=\sigma_{2}^{2})」とした場合に、2標本の不偏分散を用いて母分散が等しいかどうかを検定する「等分散性の検定」に使われます。等分散性の検定については28-3章で説明します。

■F分布の形

自由度を変化させた時のF分布の形を見てみます。次のグラフは自由度(k_{1}, k_{2})(グラフ中ではdfで表示しています)が(1, 5)、(2, 5)、(3, 5)、(10, 5)、(10, 20)である場合のF分布(黒、赤、緑、青、水色、ピンク線)です。

図1

28. 等分散性の検定とWelchのt検定

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。