BellCurve 統計WEB

  • Step1. 基礎編
  • 15. いろいろな確率分布3

15-6. 2変数の期待値と分散

12-3章では確率変数の期待値について、12-5章では確率変数の分散について学びました。この章では、2つの確率変数の和、差、共分散、相関係数について学びます。

■2つの確率変数の期待値

2つの確率変数XとYの和X+Y、差X-Yの期待値は、次に示すようにXYそれぞれの期待値E(X)E(Y)の和、差に等しくなります。

 \displaystyle E(X+Y)=E(X)+E(Y)
 \displaystyle E(X-Y)=E(X)-E(Y)

例えば、2つのさいころの出る目XYの和の期待値E(X+Y)は、次のように計算できます。

 \displaystyle E(X+Y)=E(X)+E(Y)=3.5+3.5=7

XYが独立である場合には、次の式が成り立ちます。

 \displaystyle E(XY)=E(X)E(Y)

■2つの確率変数の分散

一方、2つの確率変数XとYの和X+Y、差X-Yの分散は次に示すように、必ずしもXYそれぞれの分散V(X)V(Y)の和に等しくなるわけではありません。

 \displaystyle V(X+Y)=V(X)+V(Y)+2Cov(X,Y)
 \displaystyle V(X-Y)=V(X)+V(Y)+2Cov(X,Y)

ここで示したCov(X, Y)共分散です。共分散が0、すなわちXYが独立である場合には次の式が成り立ちます。この場合、確率変数の和の分散も差の分散もそれぞれの確率変数の分散の和に等しくなります。

 \displaystyle V(X+Y)=V(X)+V(Y)
 \displaystyle V(X-Y)=V(X)+V(Y)

■2つの確率変数の共分散

共分散とは2変数の関係の強さを表す指標の一つで、Cov(Covariance)で表されます。確率変数XYの期待値をそれぞれE(X)=\mu_xE(X)=\mu_xとすると、XYの共分散Cov(X,Y)は次の式から計算できます。

 \displaystyle Cov(X,Y)=E[(X-\mu_x)(Y-\mu_y)]

この式を展開すると、次のようになります。

     \begin{eqnarray*} \displaystyle Cov(X,Y)&=&E[(X-\mu_x)(Y-\mu_y)] \\ &=&E(XY-\mu_xY-\mu_yX+\mu_x\mu_y) \\ &=&E(XY)-\mu_xE(Y)-\mu_yE(X)+\mu_x\mu_y \\ &=&E(XY)-\mu_x\mu_y-\mu_x\mu_y+\mu_x\mu_y \\ &=&E(XY)-\mu_x\mu_y \end{eqnarray*}

XYに正の相関がある場合にはCov(X,Y)>0に、負の相関がある場合にはCov(X,Y)<0になります。上に挙げた和の分散の式は展開すると、

     \begin{eqnarray*} \displaystyle V(X+Y)&=&E[\left\{(X+Y)-(\mu_x-\mu_y)\right\}^2] \\ &=&E[(X-\mu_x)^2+(Y-\mu_y)^2+2E(X-\mu_x)(Y-\mu_y)] \\ &=&V(X)+V(Y)+2E[(X-\mu_x)(Y-\mu_y)] \\ &=&V(X)+V(Y)+2Cov(X,Y) \end{eqnarray*}

となることからも確認できます。共分散を使うと2つの確率変数XY相関係数\rhoを計算できます。相関係数はXYの共分散Cov(X,Y)をそれぞれの標準偏差で割ったものであることは26-3章で既に学びました。

 \displaystyle \rho=\frac{Cov(X,Y)}{\sqrt{V(X)V(Y)}}

例題:

次の表はAさん、Bさん、Cさんの国語の点数Xと数学の点数Yをまとめたものです。X+Yの期待値、X+Yの分散、XYの相関係数を求めてみます。

AさんBさんCさん
国語(X)405060
数学(Y)705090
合計(X+Y)110100150

E(X)=(50+60+40)/3=50E(Y)=(70+50+90)/3=70です。したがってX+Yの期待値は次のように計算できます。

 \displaystyle E(X+Y)=E(X)+E(Y)=50+70=120

また、X+Yの分散は次のように計算できます。

 \displaystyle V(X+Y)=\frac{(110-120)^2+(100-120)^2+(150-120)^2}{3}=\frac{1400}{3}

共分散の求め方は2通りあり、Cox(X,Y)=E(XY)-\mu_x\mu_yを使うと、

     \begin{eqnarray*} \displaystyle Cox(X,Y)&=&E(XY)-\mu_x\mu_y \\ &=& \frac{40\times70+50\times50+60\times90}{3}-50\times70 \\ &=& \frac{200}{3} \end{eqnarray*}

となります。一方、V(X+Y)=V(X)+V(Y)+2Cov(X,Y)を使う場合には、先にV(X)V(Y)を求めておきます。

 \displaystyle V(X)=\frac{(40-50)^2+(50-50)^2-(60-50)^2}{3}=\frac{200}{3}
 \displaystyle V(Y)=\frac{(70-70)^2+(50-70)^2-(90-70)^2}{3}=\frac{800}{3}

     \begin{eqnarray*} \displaystyle Cov(X,Y)&=&\frac{1}{2}\left\{V(X+Y)-V(X)-V(Y)\right\} \\ &=&\frac{1}{2}\left\{\frac{1400}{3}-\frac{200}{3}-\frac{800}{3} \right\} \\ &=& \frac{200}{3} \end{eqnarray*}

この共分散Cov(X,Y)を使うと相関係数\rhoは、

 \displaystyle \rho=\frac{Cov(X,Y)}{\sqrt{V(X)V(Y)}}= \frac{\frac{200}{3}}{\sqrt{\frac{200}{3} \times \frac{800}{3}}}=0.5

となります。

15. いろいろな確率分布3

大人のための統計教室 和(なごみ) 統計学やデータ分析学ぶなら、大人のための統計教室 和(なごみ)