不偏分散の平方根は標準偏差の不偏推定量か

2017/08/04

不偏分散は母分散の不偏推定量であることが知られています。では、不偏分散の正の平方根は母標準偏差の不偏推定量、つまり「不偏標準偏差」であると言えるでしょうか。結論から言うと、「不偏推定量ではない」が答えです。以下では、正規分布の場合を例にしてそれを確認します。

最初に、不偏分散 $v^2$ の式について確認しましょう。不偏分散は次のような推定量です。

$\displaystyle v^2 = \frac{1}{n-1} \sum_{i=1}^{n} \left( X_i - \bar{X} \right)^2$

その平方根 $v$ は次のようになります。単純にルートを取っているだけです。

$\displaystyle v = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} \left( X_i - \bar{X} \right)^2}$

以下では、 $n$ 個の確率変数 $X_i$ は独立に同一の正規分布 $N( \mu , \sigma^2 )$ に従うとします。これらから、 $X_i$ の母標準偏差 $\sigma$ を推定することについて考えます。不偏性の定義より $E(v)= \sigma$ が成立すれば、 $v$ は標準偏差の不偏推定量であると言えます。では、 $E(v)$ の値を具体的に計算してみましょう。

まず、カイ二乗分布の定義から、 $X_i$ を次のように変形した $Y$ は、自由度 $n-1$ のカイ二乗分布に従うことが分かっています。 $Y$ も確率変数であると考えることができます。

$\displaystyle \frac{\sum \left( X_i - \bar{X} \right)^2}{\sigma ^2} = \frac{(n-1)v^2}{\sigma^2}=Y \sim \chi^2_{n-1}$

$v$ と $Y$ の間には、次のような関係が成立します。

$\displaystyle v=\sqrt{\frac{\sigma^2}{n-1}Y}$

つまり、 $E(v)$ を求めるためにはカイ二乗分布に従う確率変数 $Y$ について、 $\sqrt{\frac{\sigma^2}{n-1}Y}$ の期待値を計算すればよいことが分かります。

自由度n-1のカイ二乗分布の確率密度関数は次の通りです。

$\chi^2_{n-1}(y) = \displaystyle \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) }$

これを用いると、 $E(v)$ は具体的に次のようになります。あとはこれを計算するだけです。統計検定1級や準1級を目指して勉強している方は自分でもチャレンジしてみてください。

$E(v)= E \left( \sqrt{\frac{\sigma^2}{n-1}Y} \right) = \displaystyle \int_{0}^{\infty} \sqrt{\frac{\sigma^2}{n-1}y} \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy$

この計算は一見難しそうに見えますが、実はとても簡単に答えを求めることができます。まずは、定数 $\sqrt{\frac{\sigma^2}{n-1}$ を積分記号の外に出してしまいましょう。

$\sqrt{\frac{\sigma^2}{n-1}} \displaystyle \int_{0}^{\infty} \sqrt{y} \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy$

次に、 $\sqrt{y}=y^{\frac{1}{2}}$ であることを利用して、 $y$ をまとめます。

$\sqrt{\frac{\sigma^2}{n-1}} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy$

ここで、 $\int$ の中身に注目してみます。自由度 $n$ のカイ二乗分布の確率密度関数は次の式で表されます。

$\chi^2_{n}(y) = \displaystyle \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right) }$

これを先程の $\int$ の中身とよく見比べると、分子の部分については全く同じ形をしていることが分かります。分母は $y$ について定数であることを利用して、積分記号の中身を自由度nのカイ二乗分布の確率密度関数と同じ形に変形してみましょう。まず、 $\int$ の中の分母を外に出してしまいます。

$\sqrt{\frac{\sigma^2}{n-1}} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}} dy$

次に、 $\chi^2_n$ の分母 $2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)$ の項に等しい項だけでできた分数 $\frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}$ を作ります。

$\sqrt{\frac{\sigma^2}{n-1}} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} \displaystyle \int_{0}^{\infty} y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}} dy$

この分母だけを $\int$ の中に入れます。分子については他の定数項とまとめます。

$\sqrt{\frac{\sigma^2}{n-1}} \frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} dy$

定数項部分にある2の指数乗の部分を整理します。これは $\sqrt{2}$ になります。

$\sqrt{\frac{2 \sigma^2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} dy$

$\int$ の中身が自由度nのカイ二乗分布の確率密度関数と全く同じになったので、確率分布についての性質「定義域全体で積分すると1になる」を利用できます。つまり積分については無視でき、定数項が $E(v)$ となります。

$E(v)= \sqrt{\frac{2 \sigma^2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} =\sqrt{\frac{2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} \sigma$

$v$ の期待値は母標準偏差 $\sigma$ の $\sqrt{\frac{2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)}$ 倍になることがわかります。この値は1ではないので、 $v$ は $\sigma$ の不偏推定量にはなりません。

一般に、不偏標準偏差は不偏分散のように分布によらず成立する式として定義することはできません。

ブログ

不偏分散の平方根は標準偏差の不偏推定量か

統計学やデータ分析を学ぶなら、大人のための統計教室和（なごみ）［業務提携］

【BellCurve監修】統計検定^®2級対策に最適な模擬問題集1～3を各500円（税込）にて販売中！

ブログ

不偏分散の平方根は標準偏差の不偏推定量か

関連記事

映画をヒットさせるには公開時期が大事！？

日本シリーズ「優勝が決まる確率」ラン...

統計学やデータ分析を学ぶなら、大人のための統計教室 和（なごみ） ［業務提携］

【BellCurve監修】統計検定®2級対策に最適な模擬問題集1～3を各500円（税込）にて販売中！

統計学やデータ分析を学ぶなら、大人のための統計教室和（なごみ）［業務提携］

【BellCurve監修】統計検定^®2級対策に最適な模擬問題集1～3を各500円（税込）にて販売中！