不偏分散の平方根は標準偏差の不偏推定量か
2017/08/04
カテゴリ:数理統計
タグ:
不偏分散は母分散の不偏推定量であることが知られています。では、不偏分散の正の平方根は母標準偏差の不偏推定量、つまり「不偏標準偏差」であると言えるでしょうか。結論から言うと、「不偏推定量ではない」が答えです。以下では、正規分布の場合を例にしてそれを確認します。
最初に、不偏分散の式について確認しましょう。不偏分散は次のような推定量です。
![Rendered by QuickLaTeX.com \displaystyle v^2 = \frac{1}{n-1} \sum_{i=1}^{n} \left( X_i - \bar{X} \right)^2](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-bacf71c020b37123857ab16ba4ced15d_l3.png)
その平方根は次のようになります。単純にルートを取っているだけです。
![Rendered by QuickLaTeX.com \displaystyle v = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n} \left( X_i - \bar{X} \right)^2}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-ee1ce71b6267ceb188a49ffd798e8ab0_l3.png)
以下では、個の確率変数
は独立に同一の正規分布
に従うとします。これらから、
の母標準偏差
を推定することについて考えます。不偏性の定義より
が成立すれば、
は標準偏差の不偏推定量であると言えます。では、
の値を具体的に計算してみましょう。
まず、カイ二乗分布の定義から、を次のように変形した
は、自由度
のカイ二乗分布に従うことが分かっています。
も確率変数であると考えることができます。
![Rendered by QuickLaTeX.com \displaystyle \frac{\sum \left( X_i - \bar{X} \right)^2}{\sigma ^2} = \frac{(n-1)v^2}{\sigma^2}=Y \sim \chi^2_{n-1}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c29d382ee041caabdd033cde77ca64b2_l3.png)
と
の間には、次のような関係が成立します。
![Rendered by QuickLaTeX.com \displaystyle v=\sqrt{\frac{\sigma^2}{n-1}Y}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-9a7ca27138a27ce21a3bb9af742e311b_l3.png)
つまり、を求めるためにはカイ二乗分布に従う確率変数
について、
の期待値を計算すればよいことが分かります。
自由度n-1のカイ二乗分布の確率密度関数は次の通りです。
![Rendered by QuickLaTeX.com \chi^2_{n-1}(y) = \displaystyle \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) }](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-0dec7874ac383fdbebf7ca4fd230c963_l3.png)
これを用いると、は具体的に次のようになります。あとはこれを計算するだけです。統計検定1級や準1級を目指して勉強している方は自分でもチャレンジしてみてください。
![Rendered by QuickLaTeX.com E(v)= E \left( \sqrt{\frac{\sigma^2}{n-1}Y} \right) = \displaystyle \int_{0}^{\infty} \sqrt{\frac{\sigma^2}{n-1}y} \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-fdc6b5cc04adf445142c357312c034d8_l3.png)
この計算は一見難しそうに見えますが、実はとても簡単に答えを求めることができます。まずは、定数を積分記号の外に出してしまいましょう。
![Rendered by QuickLaTeX.com \sqrt{\frac{\sigma^2}{n-1}} \displaystyle \int_{0}^{\infty} \sqrt{y} \frac{y^{ \left( \frac{n-1}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-f04f78bb42ace6e266bf2493ab6ac2f7_l3.png)
次に、であることを利用して、
をまとめます。
![Rendered by QuickLaTeX.com \sqrt{\frac{\sigma^2}{n-1}} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right) } dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-a4b3d2bbbad7c0d9d20218dd77f86690_l3.png)
ここで、の中身に注目してみます。自由度
のカイ二乗分布の確率密度関数は次の式で表されます。
![Rendered by QuickLaTeX.com \chi^2_{n}(y) = \displaystyle \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{ 2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right) }](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-70ca05f15679409e417e993f7b806ef4_l3.png)
これを先程のの中身とよく見比べると、分子の部分については全く同じ形をしていることが分かります。分母は
について定数であることを利用して、積分記号の中身を自由度nのカイ二乗分布の確率密度関数と同じ形に変形してみましょう。まず、
の中の分母を外に出してしまいます。
![Rendered by QuickLaTeX.com \sqrt{\frac{\sigma^2}{n-1}} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}} dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-af24a3c7611d1fa9194bea4a208c6f39_l3.png)
次に、の分母
の項に等しい項だけでできた分数
を作ります。
![Rendered by QuickLaTeX.com \sqrt{\frac{\sigma^2}{n-1}} \frac{1}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} \displaystyle \int_{0}^{\infty} y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}} dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-ec6b987dfd3d2f637f1143303307f76b_l3.png)
この分母だけをの中に入れます。分子については他の定数項とまとめます。
![Rendered by QuickLaTeX.com \sqrt{\frac{\sigma^2}{n-1}} \frac{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)}{2^{\frac{n-1}{2}} \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-5dedef61b9218a1d0d3740af81ea90f5_l3.png)
定数項部分にある2の指数乗の部分を整理します。これはになります。
![Rendered by QuickLaTeX.com \sqrt{\frac{2 \sigma^2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} \displaystyle \int_{0}^{\infty} \frac{y^{ \left( \frac{n}{2}-1 \right) } e^{- \frac{y}{2}}}{2^{\frac{n}{2}} \Gamma \left( \frac{n}{2} \right)} dy](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-e706bcbcc51b121b48f19597f1ed31cc_l3.png)
の中身が自由度nのカイ二乗分布の確率密度関数と全く同じになったので、確率分布についての性質「定義域全体で積分すると1になる」を利用できます。つまり積分については無視でき、定数項が
となります。
![Rendered by QuickLaTeX.com E(v)= \sqrt{\frac{2 \sigma^2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} =\sqrt{\frac{2}{n-1}} \frac{ \Gamma \left( \frac{n}{2} \right)}{ \Gamma \left( \frac{n-1}{2} \right)} \sigma](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-029d68a4929b405c6fe7149930d2db4d_l3.png)
の期待値は母標準偏差
の
倍になることがわかります。この値は1ではないので、
は
の不偏推定量にはなりません。
一般に、不偏標準偏差は不偏分散のように分布によらず成立する式として定義することはできません。