BellCurve 統計WEB

  • 数学ノート
  • 数学的補足

標本分散の一致性と不偏性

母分散の推定量として標本分散を用いる場合に、標本分散が「一致性」及び「不偏性」を満たしているかどうかを確認してみます。

■不偏性について

標本分散 \widehat{\sigma}^2は次の式から求めることができます。

 \displaystyle \widehat{\sigma}^2=\frac{1}{n} \sum(x_{i}-\overline{x})^{2}

(x_{i}-\overline{x})^{2}は次のように展開できます。

     \begin{eqnarray*} \displaystyle \sum(x_{i}-\overline{x})^{2} &=&\sum \left\{(x_i-\mu)^2-(\overline{x}-\mu)^{2} \right\} \\ &=&\sum(x_i-\mu)^2 -2(\overline{x}-\mu) \sum(x_i-\mu) +n(\overline{x}-\mu)^2 \cdots(A) \end{eqnarray*}

ここで、\sum(x_i-\mu)の部分は次のように変形できるので、

 \displaystyle \sum(x_i-\mu) = \sum x_i-\sum \mu= n\overline{x}-n\mu=n(\overline{x}-\mu)

(A)は次のようになります。

     \begin{eqnarray*} \displaystyle (A)&=&\sum(x_{i}-\overline{x})^{2} \\ &=&\sum(x_i-\mu)^2 -2(\overline{x}-\mu) \times n(\overline{x}-\mu) +n(\overline{x}-\mu)^2 \\ &=&\sum(x_i-\mu)^2 -2n(\overline{x}-\mu)^2+n(\overline{x}-\mu)^2 \\ &=&\sum(x_i-\mu)^2 -n(\overline{x}-\mu)^2 \end{eqnarray*}

したがって、標本分散の期待値E( \widehat{\sigma}^2)は次のように展開できます。

     \begin{eqnarray*} \displaystyle E(\widehat{\sigma}^2)&=&E\left(\frac{1}{n} \sum(x_i-\overline{x})^2 \right) \\ &=&E\left(\frac{1}{n} \times (\sum(x_i-\mu)^2 -n(\overline{x}-\mu)^2 )\right) \\ &=&E\left(\frac{1}{n} \sum(x_i-\mu)^2 \right)-E\left(\frac{1}{n} \times n(\overline{x}-\mu)^2\right) \\ &=&E\left(\frac{1}{n} \sum(x_i-\mu)^2 \right)-E\left((\overline{x}-\mu)^2 \right) \cdots (B)  \end{eqnarray*}

ここで、期待値の性質から\displaystyle E\left(\frac{1}{n} \sum(x_i-\mu)^2 \right)の部分は次のように変形ができます。

 \displaystyle E\left(\frac{1}{n} \sum(x_i-\mu)^2 \right) = \frac{1}{n}\sum(x_i-\mu)^2 = \sigma^2

また、x_iの母分散が\sigma^2のとき、標本平均の分散は

 \displaystyle E((\overline{x}-\mu)^2) = \frac{1}{n}\sigma^2

となることから、以上のことを用いて(B)は次のように展開できます。

 \displaystyle (B)=E(\widehat{\sigma}^2)=\sigma^2-\frac{1}{n}\sigma^2=\frac{n-1}{n}\sigma^2 \cdots (C)

この結果から、標本分散の期待値は母分散のよりも\displaystyle \frac{1}{n} \widehat{\sigma}^2だけ小さくなることが分かります。すなわち次の式が成り立たないため、不偏性を持ちません。

 \displaystyle E(\widehat{\sigma}^2)=\sigma^2

これは、標本分散の値を母分散の推定値として利用すると、常に母分散の値より少し小さい値となり、母分散を過小評価していることを意味します。そこで、標本分散の代わりに不偏分散を用いることで、

 \displaystyle E((\overline{x}-\mu)^2) = \frac{1}{n-1}\sigma^2

(B)の式は次のようになります。

 \displaystyle (B)'=E(\widehat{\sigma}^2)=\sigma^2-\frac{1}{n-1}\sigma^2=\frac{n-1}{n-1}\sigma^2=\sigma^2

この式は、

 \displaystyle E(\widehat{\sigma}^2)=\sigma^2

を満たすため、不偏分散は不偏性を持つことが分かります。

■一致性について

一致性は、nが大きくなった時に推定値が真の値から外れることはほとんどないことを意味します。 直接的な証明ではありませんが、次の条件が成立すれば一致性を持つことが知られています。

 E \left( \widehat{\sigma}^2 \right) \to \sigma^2  ,(n \to \infty)  V \left( \widehat{\sigma}^2 \right) \to 0   ,(n \to \infty)

(C)の式から、E \left( \widehat{\sigma}^2 \right)は次のようになります。

 \displaystyle E \left( \widehat{\sigma}^2 \right) = \frac{n-1}{n} \sigma^2 = \sigma^2 - \frac{1}{n} \sigma^2

これはnが大きくなると、\frac{1}{n} \widehat{\sigma}^2は0に近づきます。

次に\displaystyle V \left( \widehat{\sigma}^2 \right)です。 少し難しいため計算過程は省きますが、実際に計算すると次のようになります。

 \displaystyle V \left( \widehat{\sigma}^2 \right) = \frac{2(n-1) \sigma^4}{n^2}

\sigmaは定数なので、これはnが大きくなると0に近づくことが分かります。 以上のことから、標本分散は一致性を持ちます。

数学的補足

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。