BellCurve 統計WEB

未経験からデータ分析が学べる
AI関連の資格対策も多数

ブログ


不偏分散の平方根は標準偏差の不偏推定量か

2017/08/04

カテゴリ:

不偏分散は母分散の不偏推定量であることが知られています。では、不偏分散の正の平方根は母標準偏差の不偏推定量、つまり「不偏標準偏差」であると言えるでしょうか。結論から言うと、「不偏推定量ではない」が答えです。以下では、正規分布の場合を例にしてそれを確認します。

最初に、不偏分散v^2の式について確認しましょう。不偏分散は次のような推定量です。

 \displaystyle v^2 = \frac{1}{n-1} \sum_{i=1}^{n} \left( X_i - \bar{X} \right)^2

その平方根vは次のようになります。単純にルートを取っているだけです。

 \displaystyle v = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} \left( X_i - \bar{X} \right)^2}

以下では、n個の確率変数X_iは独立に同一の正規分布N( \mu , \sigma^2 )に従うとします。これらから、X_iの母標準偏差\sigmaを推定することについて考えます。不偏性の定義よりE(v)= \sigmaが成立すれば、vは標準偏差の不偏推定量であると言えます。では、E(v)の値を具体的に計算してみましょう。

まず、カイ二乗分布の定義から、X_iを次のように変形したYは、自由度n-1のカイ二乗分布に従うことが分かっています。Yも確率変数であると考えることができます。

 \displaystyle \frac{\sum \left( X_i - \bar{X} \right)^2}{\sigma ^2} = \frac{(n-1)v^2}{\sigma^2}=Y \sim \chi^2_{n-1}

vYの間には、次のような関係が成立します。

 \displaystyle v=\sqrt{\frac{\sigma^2}{n-1}Y}

つまり、E(v)を求めるためにはカイ二乗分布に従う確率変数Yについて、\sqrt{\frac{\sigma^2}{n-1}Y}の期待値を計算すればよいことが分かります。

自由度n-1のカイ二乗分布の確率密度関数は次の通りです。

 \chi^2_{n-1}(y) = \displaystyle \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) }

これを用いると、E(v)は具体的に次のようになります。あとはこれを計算するだけです。統計検定1級や準1級を目指して勉強している方は自分でもチャレンジしてみてください。

 E(v)= E \left( \sqrt{\frac{\sigma^2}{n-1}Y} \right) = \displaystyle \int_{0}^{\infty}  \sqrt{\frac{\sigma^2}{n-1}y} \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy

この計算は一見難しそうに見えますが、実はとても簡単に答えを求めることができます。まずは、定数\sqrt{\frac{\sigma^2}{n-1}を積分記号の外に出してしまいましょう。

 \sqrt{\frac{\sigma^2}{n-1}} \displaystyle \int_{0}^{\infty}  \sqrt{y} \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy

次に、\sqrt{y}=y^{\frac{1}{2}}であることを利用して、yをまとめます。

 \sqrt{\frac{\sigma^2}{n-1}} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy

ここで、\intの中身に注目してみます。自由度nのカイ二乗分布の確率密度関数は次の式で表されます。

 \chi^2_{n}(y) = \displaystyle \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right) }

これを先程の\intの中身とよく見比べると、分子の部分については全く同じ形をしていることが分かります。分母はyについて定数であることを利用して、積分記号の中身を自由度nのカイ二乗分布の確率密度関数と同じ形に変形してみましょう。まず、\intの中の分母を外に出してしまいます。

 \sqrt{\frac{\sigma^2}{n-1}} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}} dy

次に、\chi^2_nの分母2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)の項に等しい項だけでできた分数\frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}を作ります。

 \sqrt{\frac{\sigma^2}{n-1}} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)}  \frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} \displaystyle \int_{0}^{\infty} y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}} dy

この分母だけを\intの中に入れます。分子については他の定数項とまとめます。

 \sqrt{\frac{\sigma^2}{n-1}} \frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)}   \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} dy

定数項部分にある2の指数乗の部分を整理します。これは\sqrt{2}になります。

 \sqrt{\frac{2 \sigma^2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)}   \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} dy

\intの中身が自由度nのカイ二乗分布の確率密度関数と全く同じになったので、確率分布についての性質「定義域全体で積分すると1になる」を利用できます。つまり積分については無視でき、定数項がE(v)となります。

 E(v)= \sqrt{\frac{2 \sigma^2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} =\sqrt{\frac{2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} \sigma

vの期待値は母標準偏差\sigma\sqrt{\frac{2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)}倍になることがわかります。この値は1ではないので、v\sigmaの不偏推定量にはなりません。

一般に、不偏標準偏差は不偏分散のように分布によらず成立する式として定義することはできません。



統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【エクセル統計/新規ユーザー】春の年度末SALE!
【エクセル統計/新規ユーザー】春の年度末SALE!

【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)