BellCurve 統計WEB

ブログ

切断正規分布の平均値と分散

2018/03/08

カテゴリ:

概要

平均\mu、分散\sigma^2をもつ正規分布N(\mu,\sigma^2)について、ある点で切断したときの期待値と分散を計算します。

必要な数学的知識

確率分布の基本的な性質、部分積分、置換積分

具体的な計算については、高校数学程度です。

切断正規分布の確率密度関数

正規分布N(\mu,\sigma^2)確率密度関数は次の通りです

 \displaystyle p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp \left(- \frac{ \left( x - \mu \right) ^2}{2 \sigma^2} \right)

N(170.6,5.8^2)の分布は次のような形状です。

ここでx=aで分布を切断し、x\geq aのみの部分からなる分布を考えます。 切断した分布は次のような形状です。

重ねて表示すると、切断した分布の確率密度の方が大きくなっています。

この分布の確率密度関数は、p(x)x\geq aでの条件付き分布を計算することで求めることができます。

1変数の確率分布の条件付き分布

1変数の確率分布p(x)について、x\geq aのような不等式の条件付き分布q(x)は次のように計算できます。

 \displaystyle q(x)=p(x|x \geq a)= \frac{p(x)}{\int_{a}^{\infty}p(x)dx}

単純に、分布のa以上の部分q(x)= p(x) , x>aとならないことに注意しましょう。

条件付き分布の計算方法を簡単に解説します。 p(x)は確率分布であり、次の関係が成立します。

 \displaystyle \int_{-\infty}^{\infty}p(x)dx=1

条件付き分布q(x)も確率分布であるため、次の関係が成立している必要があります。

 \displaystyle  \int_{a}^{\infty}q(x)dx=1

ここで、q(x)p(x)x>aとなる部分で切り取っています。 つまりq(x)の定義域はx>aです。 このときp(x)について、次のようになります。F(\cdot)p(x)の累積分布関数です。

 \displaystyle \int_{a}^{\infty}p(x)dx=1-F(a)<1

これは確率分布の性質「積分すると1になる」を満たさないことから、単にq(x)=p(x)とすることはできないことが分かります。つまり、ある定数倍して1になるように補正すればよく、その具体的な値が、\int_{a}^{\infty}p(x)dxです。

これを利用して切断正規分布q(x)を計算しましょう。分子はp(x)そのままなので、分母を計算するだけです。

 \displaystyle q(x)= \frac{p(x)}{\int_{a}^{\infty}p(x)dx}=\frac{p(x)}{1-\Phi(\frac{a-\mu}{\sigma})}

ここで、\Phi(\cdot)は標準正規分布の累積分布関数です。

切断正規分布の期待値

q(x)が求められたので、期待値E[X]を計算します。

 \displaystyle E[X]=\int_a^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{x}{\sqrt{2\pi\sigma^2}}\exp \left( -\frac{\left( x - \mu \right)^2}{2\sigma^2} \right)

t=\frac{x-\mu}{\sigma}に変換します。

 \displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{\mu+\sigma t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)

\muの項についての積分は、分布関数を定義域で積分しているため\muとなります。

 \displaystyle =\mu +\sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)

\frac{d}{dt}\exp \left( -t^2 \right)= -t \exp \left( -t^2 \right)であることを利用すると、積分できます。

 \displaystyle =\mu + \sigma \left[ - \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty}

\lim_{t \to \infty} \exp (-t^2) =0であるため、t= \frac{a-\mu}{\sigma}の項が残ります。

 \displaystyle =\mu + \sigma  \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{(a-\mu)^2}{2\sigma^2} \right)

ここで、\sigmaの項にはx=\frac{a-\mu}{\sigma}における標準正規分布の確率密度です。 標準正規分布の確率密度関数を\phi(\cdot)と置くと、次のように書き換えることができます。

 \displaystyle =\mu + \sigma    \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}

この\frac{\phi()}{1-\Phi()}を逆ミルズ比と呼びます。

切断正規分布の分散

分散を計算します。 分散の公式V[X]=E[X^2]-E[X]^2を使うため、E[X^2]の値を求めます。

 \displaystyle E[X^2]=\int_{a}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{x^2}{\sqrt{2\pi\sigma^2}}\exp \left( -\frac{\left( x - \mu \right)^2}{2\sigma^2} \right)

変数変換します。

 \displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{(\mu + \sigma t)^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)

(\mu + \sigma t)^2を展開します

 \displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{\mu^2 + \2\mu \sigma t + \sigma^2 t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)

展開した項のtの次数で分割します。

     \begin{equation*} \begin{split} \displaystyle &=\mu^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &\quad +2\mu \sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \end{split} \end{equation*}

ここで第一項の積分は、確率分布の性質から1となります。

     \begin{equation*} \begin{split} \displaystyle &=\mu^2 \\ &\quad +2\mu \sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \end{split} \end{equation*}

第2項は、\frac{d}{dx} \exp \left( -\frac{x^2}{2} \right) = -x \exp \left( -\frac{x^2}{2} \right) であるので、そのまま積分できます。

     \begin{equation*} \begin{split} \displaystyle &=\mu^2 \\ &\quad +2\mu \sigma \left[ - \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty} \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &=\mu^2 \\ &\quad +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ \end{split} \end{equation*}

最後の第3項です。部分積分の公式を用いて変形します。

     \begin{equation*} \begin{split} \displaystyle &=\mu^2 \\ &\quad +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \left[ - \frac{t}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty} \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &=\mu^2 \\ &\quad +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \frac{a-\mu}{\sigma}  \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2  \end{split} \end{equation*}

E[X^2]が計算できたので、V[X]を計算しましょう。

     \begin{equation*} \begin{split} V[X] &=\mu^2 +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}+ \sigma^2 \frac{a-\mu}{\sigma}  \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} +\sigma^2 \\ &\quad -\left( \mu + \sigma    \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2\\ &=\sigma^2 + \sigma^2 \frac{a-\mu}{\sigma}  \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} - \sigma^2   \left( \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2 \end{split} \end{equation*}

これを整理すると、次の値になります。

 \sigma^2 \left\{ 1+ \frac{a-\mu}{\sigma}  \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} - \left( \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2 \right\}
データセンス超入門セミナー | 大人のための統計教室 和(なごみ)