切断正規分布の平均値と分散

2018/03/08

カテゴリ：数理統計

概要

平均 $\mu$ 、分散 $\sigma^2$ をもつ正規分布 $N(\mu,\sigma^2)$ について、ある点で切断したときの期待値と分散を計算します。

必要な数学的知識

確率分布の基本的な性質、部分積分、置換積分

具体的な計算については、高校数学程度です。

切断正規分布の確率密度関数

正規分布 $N(\mu,\sigma^2)$ の確率密度関数は次の通りです

$\displaystyle p(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp \left(- \frac{ \left( x - \mu \right) ^2}{2 \sigma^2} \right)$

$N(170.6,5.8^2)$ の分布は次のような形状です。

ここで $x=a$ で分布を切断し、 $x\geq a$ のみの部分からなる分布を考えます。切断した分布は次のような形状です。

重ねて表示すると、切断した分布の確率密度の方が大きくなっています。

この分布の確率密度関数は、 $p(x)$ の $x\geq a$ での条件付き分布を計算することで求めることができます。

1変数の確率分布の条件付き分布

1変数の確率分布p(x)について、 $x\geq a$ のような不等式の条件付き分布 $q(x)$ は次のように計算できます。

$\displaystyle q(x)=p(x|x \geq a)= \frac{p(x)}{\int_{a}^{\infty}p(x)dx}$

単純に、分布のa以上の部分 $q(x)= p(x) , x>a$ とならないことに注意しましょう。

条件付き分布の計算方法を簡単に解説します。 $p(x)$ は確率分布であり、次の関係が成立します。

$\displaystyle \int_{-\infty}^{\infty}p(x)dx=1$

条件付き分布 $q(x)$ も確率分布であるため、次の関係が成立している必要があります。

$\displaystyle \int_{a}^{\infty}q(x)dx=1$

ここで、 $q(x)$ は $p(x)$ を $x>a$ となる部分で切り取っています。つまり $q(x)$ の定義域は $x>a$ です。このとき $p(x)$ について、次のようになります。 $F(\cdot)$ は $p(x)$ の累積分布関数です。

$\displaystyle \int_{a}^{\infty}p(x)dx=1-F(a)<1$

これは確率分布の性質「積分すると1になる」を満たさないことから、単に $q(x)=p(x)$ とすることはできないことが分かります。つまり、ある定数倍して1になるように補正すればよく、その具体的な値が、 $\int_{a}^{\infty}p(x)dx$ です。

これを利用して切断正規分布 $q(x)$ を計算しましょう。分子は $p(x)$ そのままなので、分母を計算するだけです。

$\displaystyle q(x)= \frac{p(x)}{\int_{a}^{\infty}p(x)dx}=\frac{p(x)}{1-\Phi(\frac{a-\mu}{\sigma})}$

ここで、 $\Phi(\cdot)$ は標準正規分布の累積分布関数です。

切断正規分布の期待値

$q(x)$ が求められたので、期待値 $E[X]$ を計算します。

$\displaystyle E[X]=\int_a^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{x}{\sqrt{2\pi\sigma^2}}\exp \left( -\frac{\left( x - \mu \right)^2}{2\sigma^2} \right)$

$t=\frac{x-\mu}{\sigma}$ に変換します。

$\displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{\mu+\sigma t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)$

$\mu$ の項についての積分は、分布関数を定義域で積分しているため $\mu$ となります。

$\displaystyle =\mu +\sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)$

$\frac{d}{dt}\exp \left( -t^2 \right)= -t \exp \left( -t^2 \right)$ であることを利用すると、積分できます。

$\displaystyle =\mu + \sigma \left[ - \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty}$

$\lim_{t \to \infty} \exp (-t^2) =0$ であるため、 $t= \frac{a-\mu}{\sigma}$ の項が残ります。

$\displaystyle =\mu + \sigma \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{(a-\mu)^2}{2\sigma^2} \right)$

ここで、 $\sigma$ の項には $x=\frac{a-\mu}{\sigma}$ における標準正規分布の確率密度です。標準正規分布の確率密度関数を $\phi(\cdot)$ と置くと、次のように書き換えることができます。

$\displaystyle =\mu + \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}$

この $\frac{\phi()}{1-\Phi()}$ を逆ミルズ比と呼びます。

切断正規分布の分散

分散を計算します。分散の公式 $V[X]=E[X^2]-E[X]^2$ を使うため、 $E[X^2]$ の値を求めます。

$\displaystyle E[X^2]=\int_{a}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{x^2}{\sqrt{2\pi\sigma^2}}\exp \left( -\frac{\left( x - \mu \right)^2}{2\sigma^2} \right)$

変数変換します。

$\displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{(\mu + \sigma t)^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)$

$(\mu + \sigma t)^2$ を展開します

$\displaystyle =\int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{\mu^2 + \2\mu \sigma t + \sigma^2 t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right)$

展開した項のtの次数で分割します。

$\begin{equation*} \begin{split} \displaystyle &=\mu^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &\quad +2\mu \sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \end{split} \end{equation*}$

ここで第一項の積分は、確率分布の性質から1となります。

$\begin{equation*} \begin{split} \displaystyle &=\mu^2 \\ &\quad +2\mu \sigma \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \end{split} \end{equation*}$

第2項は、 $\frac{d}{dx} \exp \left( -\frac{x^2}{2} \right) = -x \exp \left( -\frac{x^2}{2} \right)$ であるので、そのまま積分できます。

$\begin{equation*} \begin{split} \displaystyle &=\mu^2 \\ &\quad +2\mu \sigma \left[ - \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty} \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &=\mu^2 \\ &\quad +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{t^2}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ \end{split} \end{equation*}$

最後の第3項です。部分積分の公式を用いて変形します。

$\begin{equation*} \begin{split} \displaystyle &=\mu^2 \\ &\quad +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \left[ - \frac{t}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \right]_{\frac{a-\mu}{\sigma}}^{\infty} \\ &\quad +\sigma^2 \int_{\frac{a-\mu}{\sigma}}^{\infty} \frac{1}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}\frac{1}{\sqrt{2\pi}}\exp \left( -\frac{t^2}{2} \right) \\ &=\mu^2 \\ &\quad +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \frac{a-\mu}{\sigma} \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \\ &\quad +\sigma^2 \end{split} \end{equation*}$

$E[X^2]$ が計算できたので、 $V[X]$ を計算しましょう。

$\begin{equation*} \begin{split} V[X] &=\mu^2 +2\mu \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)}+ \sigma^2 \frac{a-\mu}{\sigma} \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} +\sigma^2 \\ &\quad -\left( \mu + \sigma \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2\\ &=\sigma^2 + \sigma^2 \frac{a-\mu}{\sigma} \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} - \sigma^2 \left( \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2 \end{split} \end{equation*}$

これを整理すると、次の値になります。

$\sigma^2 \left\{ 1+ \frac{a-\mu}{\sigma} \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} - \left( \frac{\phi \left( \frac{a-\mu}{\sigma} \right)}{1-\Phi \left( \frac{a-\mu}{\sigma} \right)} \right)^2 \right\}$

ブログ