切断正規分布の平均値と分散
2018/03/08
カテゴリ:数理統計
タグ:
概要
平均、分散
をもつ正規分布
について、ある点で切断したときの期待値と分散を計算します。
必要な数学的知識
確率分布の基本的な性質、部分積分、置換積分
具体的な計算については、高校数学程度です。
切断正規分布の確率密度関数
正規分布の確率密度関数は次の通りです
![Rendered by QuickLaTeX.com \displaystyle p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp \left(- \frac{ \left( x - \mu \right) ^2}{2 \sigma^2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-061d9c9471323c4d6055a4becdc233eb_l3.png)
の分布は次のような形状です。
![](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2018/02/normald.png)
ここでで分布を切断し、
のみの部分からなる分布を考えます。
切断した分布は次のような形状です。
![](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2018/02/normalcd.png)
重ねて表示すると、切断した分布の確率密度の方が大きくなっています。
![](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2018/02/normalad.png)
この分布の確率密度関数は、の
での条件付き分布を計算することで求めることができます。
1変数の確率分布の条件付き分布
1変数の確率分布p(x)について、のような不等式の条件付き分布
は次のように計算できます。
![Rendered by QuickLaTeX.com \displaystyle q(x)=p(x|x \geq a)= \frac{p(x)}{\int_{a}^{\infty}p(x)dx}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-e98fab1c097a09b73a052dc6a42d3e72_l3.png)
単純に、分布のa以上の部分とならないことに注意しましょう。
条件付き分布の計算方法を簡単に解説します。
は確率分布であり、次の関係が成立します。
![Rendered by QuickLaTeX.com \displaystyle \int_{-\infty}^{\infty}p(x)dx=1](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-348d15af922e91f611771d03c92c34eb_l3.png)
条件付き分布も確率分布であるため、次の関係が成立している必要があります。
![Rendered by QuickLaTeX.com \displaystyle \int_{a}^{\infty}q(x)dx=1](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-fabe17b23113e8ce3c0b2bdb33570fa6_l3.png)
ここで、は
を
となる部分で切り取っています。
つまり
の定義域は
です。
このとき
について、次のようになります。
は
の累積分布関数です。
![Rendered by QuickLaTeX.com \displaystyle \int_{a}^{\infty}p(x)dx=1-F(a)<1](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-eb9bbe4a75d12606e02401d71ec1ee98_l3.png)
これは確率分布の性質「積分すると1になる」を満たさないことから、単にとすることはできないことが分かります。つまり、ある定数倍して1になるように補正すればよく、その具体的な値が、
です。
これを利用して切断正規分布を計算しましょう。分子は
そのままなので、分母を計算するだけです。
![Rendered by QuickLaTeX.com \displaystyle q(x)= \frac{p(x)}{\int_{a}^{\infty}p(x)dx}=\frac{p(x)}{1-\Phi(\frac{a-\mu}{\sigma})}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-76fa677ad7dd7b14fd95cd463d0f371e_l3.png)
ここで、は標準正規分布の累積分布関数です。
切断正規分布の期待値
が求められたので、期待値
を計算します。
![Rendered by QuickLaTeX.com \displaystyle E[X]=\int_a^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{x}{\sqrt{2\pi\sigma^2}}\exp \left( -\frac{\left( x - \mu \right)^2}{2\sigma^2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-701d8ebe21c143cb62329f5e31241a86_l3.png)
に変換します。
![Rendered by QuickLaTeX.com \displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{\mu+\sigma t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-e859104e67b278978f3437f6338cea7f_l3.png)
の項についての積分は、分布関数を定義域で積分しているため
となります。
![Rendered by QuickLaTeX.com \displaystyle =\mu +\sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-f66aeb3e7ee5e9eb42bdfbc26965b249_l3.png)
であることを利用すると、積分できます。
![Rendered by QuickLaTeX.com \displaystyle =\mu + \sigma \left[ - \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-9989d93553f05affac5598fa37ee84f5_l3.png)
であるため、
の項が残ります。
![Rendered by QuickLaTeX.com \displaystyle =\mu + \sigma \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{(a-\mu)^2}{2\sigma^2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c611a6d961fe5ef88035d7db1f32ed21_l3.png)
ここで、の項には
における標準正規分布の確率密度です。
標準正規分布の確率密度関数を
と置くと、次のように書き換えることができます。
![Rendered by QuickLaTeX.com \displaystyle =\mu + \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-2380b95a12b4985602055696d74c81a8_l3.png)
このを逆ミルズ比と呼びます。
切断正規分布の分散
分散を計算します。
分散の公式を使うため、
の値を求めます。
![Rendered by QuickLaTeX.com \displaystyle E[X^2]=\int_{a}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{x^2}{\sqrt{2\pi\sigma^2}}\exp \left( -\frac{\left( x - \mu \right)^2}{2\sigma^2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-37288fe27963e7972546dbef77e872ec_l3.png)
変数変換します。
![Rendered by QuickLaTeX.com \displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{(\mu + \sigma t)^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-da9cf20159f325b0c1fb9425aa0bb527_l3.png)
を展開します
![Rendered by QuickLaTeX.com \displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{\mu^2 + \2\mu \sigma t + \sigma^2 t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-dd9c75b90653fa8372d882178460c8b2_l3.png)
展開した項のtの次数で分割します。
ここで第一項の積分は、確率分布の性質から1となります。
第2項は、
であるので、そのまま積分できます。
最後の第3項です。部分積分の公式を用いて変形します。
が計算できたので、
を計算しましょう。
これを整理すると、次の値になります。
![Rendered by QuickLaTeX.com \sigma^2 \left\{ 1+ \frac{a-\mu}{\sigma} \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} - \left( \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2 \right\}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-a649fcf793b9851e1498e0e99e2dfeb2_l3.png)