BellCurve 統計WEB

  • Step1. 基礎編
  • 22. 母分散の区間推定

22-1. カイ二乗分布

カイ二乗分布は、Z_{1}, Z_{2}, …, Z_{k}が互いに独立で標準正規分布N(0, 1)に従う確率変数であるときに、次の式から算出される自由度k\chi^{2}が従う確率分布のことです。

 \displaystyle \chi^{2}=Z_{1}^{2}+Z_{2}^{2}+\cdots+Z_{k}^{2}

\chiは「カイ」と読みます。自由度が1のとき、カイ二乗分布は標準正規分布に従う確率変数を二乗したものに等しくなります。

 \displaystyle \chi^{2}(1)=Z_{1}^{2}

自由度がkのとき、カイ二乗分布の確率密度関数は次の式で表すことができます。\Gamma()はガンマ関数を表します。カイ二乗分布の式は非常に複雑ですが、覚える必要はありません。

     \begin{eqnarray*} f(x;k)=\left\{ \begin{array}{ll}  \vspace{3mm} \displaystyle \frac{1}{2^{\frac{k}{2}} \Gamma(\frac{k}{2})}e^{-\frac{x}{2}} x^{\frac{k}{2}-1} & (0 \leq x ) \\ 0 & (x < 0) \\ \end{array} \right. \end{eqnarray*}

カイ二乗分布は「母分散の区間推定(22-3章)」や「適合度の検定(25‐4章)」、「独立性の検定(25-5章)」を行う際に使われます。カイ二乗分布はt分布と同様、自由度によって形が異なる分布です。自由度を変化させた時のカイ二乗分布の形を見てみます。次のグラフは自由度(グラフ中ではdfで表示しています)が1, 2, 3, 5, 10である場合のカイ二乗分布(黒、赤、緑、青、水色線)です。

図1

■カイ二乗分布の性質

  1. 期待値と分散

    確率変数Xが自由度kのカイ二乗分布に従っている時、Xの期待値E(X)と分散V(X)は次のようになります。

     \displaystyle E(X)=k
     \displaystyle V(X)=2k
  2. 再生性

    2つの確率変数X_1, X_2がそれぞれ独立に自由度k_1, k_2のカイ二乗分布\chi^{2}(k_1), \chi^{2}(k_2)に従うとき、X_1+X_2は自由度k_1+k_2のカイ二乗分布\chi^{2}(k_1+k_2)に従います。

  3. 正規分布に従う母集団からの無作為標本

    確率変数X_{1}, X_{2}, …, X_{k}がそれぞれ独立に正規分布N(\mu, \sigma^{2})に従うとき、次の式から算出される値は自由度kのカイ二乗分布に従います。

     \displaystyle \sum_{i=1}^{k} \left( \frac{X_i-\mu}{\sigma} \right)^2 \sim \chi^2(k)

    また、この式を展開して得られる次の式の値は自由度k-1のカイ二乗分布に従います。\overline{X}は標本平均をS^2は不偏分散を表します。

     \displaystyle \sum_{i=1}^{k} \left( \frac{X_i-\overline{X}}{\sigma} \right)^2=\frac{(k-1)S^2}{\sigma^2} \sim \chi^2(k-1)
  4. カイ二乗分布と指数分布の関係

    自由度2のカイ二乗分布は\displaystyle \lambda=\frac{1}{2}指数分布と一致します。

     \displaystyle f(x;2)=\frac{1}{2^{\frac{2}{2}} \Gamma(\frac{2}{2})}e^{-\frac{x}{2}} x^{\frac{2}{2}-1}=\frac{1}{2 \times \Gamma(1)}e^{-\frac{x}{2}}=\frac{1}{2}e^{-\frac{x}{2}}

■おすすめ書籍

WEBで公開されているハンバーガー統計学が書籍化したものです。ハンバーガショップの話を軸に進んでいくので、理解しやすいです。





22. 母分散の区間推定

事前に読むと理解が深まる- 学習内容が難しかった方に -