BellCurve 統計WEB

未経験からデータ分析が学べる
未経験からデータ分析が学べる
  • Step2. 中級編
  • 3. 離散型確率分布

3-4. 多項分布


■多項分布

事象 A_i(i=1, 2, \cdots, k) が起きる確率をそれぞれ p_i (p_1 + p_2 + \cdots + p_k = 1) とします。確率変数 X(X_1, X_2, \cdots, X_k) が多項分布に従う場合、それぞれの試行が x_i(x_1 + x_2 \cdots + x_k = x) 回起こる確率は次の式から計算できます。

     \begin{eqnarray*} \displaystyle P(X_1 = x_1, X_2 = x_2, \cdots, X_k = x_k) = \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ \end{eqnarray*}

k=2 の場合を考えてみます。このとき、

     \begin{eqnarray*} \displaystyle P(X_1 = x_1, X_2 = x_2) = \frac{x!}{x_1!x_2!} p^{x_1}_1 p^{x_2}_2 \\ \end{eqnarray*}

となります。ただし、p_1 + p_2 = 1x_1 + x_2 = x であることから、この式は次のように書き換えられます。

     \begin{eqnarray*} \displaystyle P(X_1 = x_1, X_2 = x_2) &=& \frac{x!}{x_1!x_2!} p^{x_1}_1 p^{x_2}_2 \\ &=& \frac{x!}{x_1!(x-x_1)!} p^{x_1}_1 (1-p_1)^{x-x_1} \\  &=& _{x}C_{x_1}p^{x_1}_1 (1-p_1)^{x-x_1} \\ \end{eqnarray*}

この式は、成功確率が p_1 のベルヌーイ試行を x 回行うときに成功する回数 x_1 が従う確率分布である「二項分布」を表しています。すなわち、k=2 における多項分布の確率分布は二項分布と一致します。

例題:

あるゲームセンターにおいてあるじゃんけんマシーンは、「グー」「チョキ」「パー」がそれぞれ「20%」「30%」「50%」の確率で出ます。グー、チョキ、パーそれぞれが出る回数 X が多項分布分布に従うとすると、このじゃんけんマシーンで5回遊んだ場合に「グー」が2回、「チョキ」が2回、「パー」が1回出る確率はいくらでしょうか。


グーが出る事象を A_1、チョキが出る事象を A_2、パーが出る事象を A_3 とします。このときそれぞれの事象 (X_1, X_2, X_3) が起きる確率とその回数は (p_1=0.2, n_1=2), (p_2=0.3, n_2=2), (p_3=0.5, n_3=1) となります。したがって、求める確率は

     \begin{eqnarray*} \displaystyle P(X_1 = 2, X_2 = 2, X_3 = 1) = \frac{5!}{2!2!1!} \times 0.2^{2} \times 0.3^{2} \times 0.5^{1} = 0.054 \\ \end{eqnarray*}

となります。

■期待値の算出

多項分布の期待値を求めます。

     \begin{eqnarray*} \displaystyle E[X_i] &=& \sum^{k}_{x_i=1} x_i \times \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} x_i \times \frac{x!}{x_1!x_2! \cdots x_i! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} x_i \times \frac{x!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} \frac{x!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i}_i \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} \frac{x(x-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p_ip^{x_i-1}_i \cdots p^{x_k}_k \\ &=& xp_i \times \sum^{k}_{x_i=1} \frac{(x-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i-1}_i \cdots p^{x_k}_k \\ \end{eqnarray*}

ここで、\displaystyle \frac{(x-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i-1}_i \cdots p^{x_k}_k は多項分布の確率質量関数を表します。したがって、

     \begin{eqnarray*} \displaystyle  &=& xp_i \times \sum^{k}_{x_i=1} \frac{(x-1)!}{x_1!x_2! \cdots (x_i-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i-1}_i \cdots p^{x_k}_k \\ &=& xp_i \times 1 \\ &=& xp_i \\ \end{eqnarray*}

となります。


■分散の算出

分散を求めるには、V[X]=E[X^2] - \left\{E[X] \right\}^2を使います。まず多項式におけるE[X^2_i]を求めます。

     \begin{eqnarray*} \displaystyle E[X^2_i] &=& \sum^{k}_{x_i=1} x^2_i \times \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} \{x_i(x_i-1)+x_i\} \times \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} x_i(x_i-1) \times \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k + \sum^{k}_{x_i=1} x_i \times \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{x_i=1} \frac{x!}{x_1!x_2! \cdots (x_i-2) \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k + xp_i \\ &=& \sum^{k}_{x_i=1} \frac{x(x-1)(x-2)!}{x_1!x_2! \cdots (x_i-2) \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{2}_{i} p^{x_{i}-2}_{i} \cdots p^{x_k}_k + xp_i \\ &=& x(x-1)p^{2}_{i} \sum^{k}_{x_i=1} \frac{(x-2)!}{x_1!x_2! \cdots (x_i-2) \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_{i}-2}_{i} \cdots p^{x_k}_k + xp_i \\ \end{eqnarray*}

ここで、\displaystyle \sum^{k}_{x_i=1} \frac{(x-2)!}{x_1!x_2! \cdots (x_i-2) \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_{i}-2}_{i} \cdots p^{x_k}_k は多項分布の確率質量関数を表します。したがって、

     \begin{eqnarray*} \displaystyle &=& x(x-1)p^{2}_{i} \sum^{k}_{x_i=1} \frac{(x-2)!}{x_1!x_2! \cdots (x_i-2) \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_{i}-2}_{i} \cdots p^{x_k}_k + xp_i \\ &=& x(x-1)p^{2}_{i} \times 1 + xp_i \\ &=& x(x-1)p^{2}_{i} + xp_i \\ \end{eqnarray*}

となります。次に\left\{E[X] \right\}^2を求めます。

 \displaystyle \left\{E[X] \right\}^2 = x^2p^2_i

これらを使って分散V[X]を求めると、

     \begin{eqnarray*} \displaystyle V[X] &=& E[X^2] - \left\{E[X] \right\}^2 \\ &=& x(x-1)p^{2}_{i} + xp_i - x^2p^2_i \\ &=& x^2p^{2}_{i} -xp^{2}_{i} + xp_i - x^2p^2_i \\ &=& -xp^{2}_{i} + xp_i \\ &=& xp_i(1-p_{i}) \\ \end{eqnarray*}

となります。


■共分散の算出

X_iX_jの共分散を求めるには、Cov[X_i, X_j]=E[X_i X_j] - E[X_i]E[X_j]を使います。まず多項式におけるE[X_i X_j]を求めます。

     \begin{eqnarray*} \displaystyle E[X_i X_j] &=& \sum^{n}_{x_i=1} x_i x_j \times \frac{x!}{x_1!x_2! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{} x_i x_j \times \frac{x!}{x_1!x_2! \cdots x_i!x_j! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{} x_i x_j \times \frac{x!}{x_1!x_2! \cdots (x_i-1)!(x_j-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_k}_k \\ &=& \sum^{k}_{} \frac{x!}{x_1!x_2! \cdots (x_i-1)!(x_j-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i}_i \cdots p^{x_k}_k \\ &=& \sum^{k}_{} \frac{x(x-1)(x-2)!}{x_1!x_2! \cdots (x_i-1)!(x_j-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p_ip^{x_i-1}_i p_jp^{x_j-1}_j \cdots p^{x_k}_k \\ &=& x(x-1)p_i p_j \times \sum^{k}_{} \frac{(x-2)!}{x_1!x_2! \cdots (x_i-1)!(x_j-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i-1}_i p^{x_j-1}_j \cdots p^{x_k}_k \\ \end{eqnarray*}

ここで、\displaystyle \sum^{k}_{} \frac{(x-2)!}{x_1!x_2! \cdots (x_i-1)!(x_j-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i-1}_i p^{x_j-1}_j \cdots p^{x_k}_k は多項分布の確率質量関数を表します。したがって、

     \begin{eqnarray*} \displaystyle &=& x(x-1)p_i p_j \times \sum^{k}_{} \frac{(x-2)!}{x_1!x_2! \cdots (x_i-1)!(x_j-1)! \cdots x_k!} p^{x_1}_1 p^{x_2}_2 \cdots p^{x_i-1}_i p^{x_j-1}_j \cdots p^{x_k}_k \\ &=& x(x-1)p_i p_j \times 1 \\ &=& x(x-1)p_i p_j \\ \end{eqnarray*}

これを使って共分散Cov[X_i, X_j]を求めると、

     \begin{eqnarray*} \displaystyle Cov[X_i, X_j] &=& E[X_i X_j] - E[X_i]E[X_j] \\ &=& x(x-1)p_i p_j - xp_i xp_j \\ &=& x^2 p_i p_j - x p_i p_j - x^2p_i p_j \\ &=& - x p_i p_j \\ \end{eqnarray*}

となります。


3. 離散型確率分布


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)