- Step1. 基礎編
- 15. いろいろな確率分布3
15-5. 2変数の確率分布
確率変数がとる値とその値をとる確率の対応を表したものが「確率分布」であることは11-1章で既に学びました。この章では、確率変数が2つある場合に、それぞれの確率変数がとる値とその確率の分布を表す「同時確率分布」について学びます。確率変数が離散型である場合には「離散型同時確率分布」といい、確率変数が連続型である場合には「連続型同時確率分布」といいます。
■離散型同時確率分布
あるクラスの生徒40人の血液型を集計した次のようなデータについて考えます。
A型 | O型 | B型 | AB型 | 計 | |
---|---|---|---|---|---|
男子 | 10 | 4 | 4 | 2 | 20 |
女子 | 8 | 8 | 2 | 2 | 20 |
上の表をそれぞれ割合(確率)に書き換えてみます。例えば、男子でA型の生徒の確率は10/40=0.25になります。
A型 | O型 | B型 | AB型 | |
---|---|---|---|---|
男子 | 0.25 | 0.1 | 0.1 | 0.05 |
女子 | 0.2 | 0.2 | 0.05 | 0.05 |
このように2つの離散型確率変数と
がそれぞれある値をとるときの確率を表したものを「同時確率分布」といいます。
が
を、
が
をとるときの同時確率分布は
![Rendered by QuickLaTeX.com \displaystyle f(x_i, y_j)=P(X=x_i, Y=y_j)~~~~~(i=1, 2, \cdots ; j=1, 2, \cdots)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-28cb56ea4d3d6e8ea5755035f48121c5_l3.png)
と表します。また、を「同時確率関数」といいます。確率の総和は必ず1になるので、同時確率分布に関して次の式が成り立ちます。
![Rendered by QuickLaTeX.com \displaystyle \sum_i \sum_j {f(x_i, y_j)}=1](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-f404657c3cb33c482ee6514f886c736a_l3.png)
次に、それぞれの確率変数をとる確率の合計を算出してみます。
A型 | O型 | B型 | AB型 | 計 | |
---|---|---|---|---|---|
男子 | 0.25 | 0.1 | 0.1 | 0.05 | 0.5 |
女子 | 0.2 | 0.2 | 0.05 | 0.05 | 0.5 |
計 | 0.45 | 0.3 | 0.15 | 0.1 | 1 |
この表を見ると、A型の合計確率は0.45、O型の合計確率は0.3であることが分ります。このように、ある1つの確率変数を抜き出して(それ以外の確率変数は無視して)、その確率の総和を求めたものを「周辺確率分布」といいます。が
を、
が
をとるときの周辺確率分布は、
![Rendered by QuickLaTeX.com \displaystyle f_x(x_i)=\sum_j{f(x_i, y_j)}=P(X=x_i)~~~~~(i=1, 2, \cdots)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-32057ccfab071a4053b4e7caf2dd9fb9_l3.png)
![Rendered by QuickLaTeX.com \displaystyle f_y(y_j)=\sum_i{f(x_i, y_j)}=P(X=y_j)~~~~~(j=1, 2, \cdots)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-21d116226152b271c0a19e9ec2d434a2_l3.png)
と表します。と
をそれぞれ
と
の「周辺確率関数」といいます。
■連続型同時確率分布
と
がそれぞれ連続型確率変数である場合、
と
の同時確率分布を表す関数を「同時確率密度関数」といい、
で表します。同時確率密度関数を使うと、
となる確率
を求めることができます。
![Rendered by QuickLaTeX.com \displaystyle P(a \leq X \leq b, c \leq Y \leq d)=\int_a^b \int_c^d {f(x,y)dxdy}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-007f0186e67e1b882ebb59416d26ebfe_l3.png)
確率の総和は必ず1になるので、同時確率密度関数に関して次の式が成り立ちます。
![Rendered by QuickLaTeX.com \displaystyle \int_{-\infty}^{\infty}\int_{-\infty}^{\infty}{f(x,y)dxdy}=1](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-8a22bd5037dccf0f68b3ed6d05e116fb_l3.png)
また、と
それぞれの「周辺確率密度関数」である
と
は次の式から求められます。
![Rendered by QuickLaTeX.com \displaystyle f_x(x)=\int_{-\infty}^{\infty}{f(x,y)dy}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-fe6405875da0a31f3d6e6269e5b61e25_l3.png)
![Rendered by QuickLaTeX.com \displaystyle f_y(y)=\int_{-\infty}^{\infty}{f(x,y)dx}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-068bdd4a94f2d21515956db3914c32e7_l3.png)
例えば、次のような同時確率密度関数について考えてみます。
![Rendered by QuickLaTeX.com \displaystyle f(x,y) = \begin{cases} x+y~~~~~(0 \leq x \leq 1, 0 \leq y \leq 1) \\ 0~~~~~(other) \end{cases}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-d441f35f7ba7a85275de1cb2e5631016_l3.png)
この式から、となる確率を求めると次のようになります。
の周辺確率密度関数を求めてみます。
の範囲では、
と計算できるので、まとめると次のようになります。
![Rendered by QuickLaTeX.com \displaystyle f_x(x) = \begin{cases} x+\frac{1}{2}~~~~~(0 \leq x \leq 1) \\ 0~~~~~(other) \end{cases}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-b28904e86d787128d0ffe083a0cfe75d_l3.png)
の周辺確率密度関数も同様に計算できます。
![Rendered by QuickLaTeX.com \displaystyle f_y(y) = \begin{cases} y+\frac{1}{2}~~~~~(0 \leq y \leq 1) \\ 0~~~~~(other) \end{cases}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-2953c17056a5e58e736e354ca68a7593_l3.png)