BellCurve 統計WEB

  • Step1. 基礎編
  • 13. いろいろな確率分布1

13-3. ポアソン分布

■ポアソン分布の"素"となる二項分布

ある交差点で1年間のうち事故が起こる日数とその確率について考えます。これは、事故が起こるか起こらないかのベルヌーイ試行と考えることができます。ここでは1日に事故が起こる確率をp=0.0001とします。このとき、1年間(n=365)のうち事故が起こる日数を確率変数Xとすると、k日事故が起こる確率は二項分布の一般式にあてはめて次のように計算できます(ただし、1日に2回以上事故は起こらないものとします)。

     \begin{eqnarray*} \lefteqn{P(X=k)} \\ &=& {}_{n} \mathrm{C}_{k}  p^{k}  (1-p)^{n-k}\\ &=& {}_{365} \mathrm{C}_{k} \times 0.0001^{k} \times (1-0.0001)^{n-k} \hspace{5mm} (k=0,1,2,\cdots,365) \end{eqnarray*}

二項分布B(n,p)では、確率変数Xの期待値はE(X)=npによって求められることは13-2章で既に学びました。npはある事象が起こる平均回数を表します。

■ポアソン分布

ここでnpを一定の値「\lambda(ラムダ)」とおき、np=\lambdaのままでnを十分大きくpを十分に小さくした場合の二項分布は、平均\lambdaポアソン分布に近似することができます。ポアソン分布は「ある期間に平均\lambda 回起こる現象が、ある期間にX回起きる確率の分布」と言い換えられます。

図1

Xがポアソン分布に従うとき、「X \sim Po(\lambda)」と書きます。\lambdaがポアソン分布でのパラメータです。確率変数Xがポアソン分布に従う場合、ある期間に平均\lambda回起こる現象がk回起こる確率、すなわちX=kとなる確率は次の式から計算できます。

     \begin{eqnarray*}  P(X=k)= \displaystyle\frac{e^{-\lambda} \lambda^{k}}{k!} & (k=0,1,2, \cdots ) \\ \end{eqnarray*}

e」は「ネイピア数」あるいは「自然対数の底」と呼ばれる定数で、「e=2.7182818 \cdots」という無限に続く値をもちます。

例題:

製品Aを作る工場では平均して200個に1個の割合で不良品が発生します。製造された製品Aを10個抜き取る時、この中に不良品が含まれる個数Xがポアソン分布に従うとすると、不良品が1個含まれる(X=1となる)確率はいくらでしょうか。

図2

不良品が発生する確率は\displaystyle p=\frac{1}{200}、抜き取り検査をした個数はn=10であることから、

 \displaystyle \lambda=np=10\times \frac{1}{200}=0.05

となります。したがって、

  P(X=1)= \displaystyle\frac{e^{-\lambda} \lambda^{k}}{k!}= \displaystyle \frac{e^{-0.05} \times 0.05^{1}}{1!}=0.048

と計算され、10個の抜き取り検査で不良品が1個含まれる確率は約4.8%となります。

※この計算は、関数電卓もしくはExcelなどを使って行ってください。

■ポアソン分布のグラフ

同様の計算を行い、この製品Aの10個の抜き取り検査においてX個の不良品が含まれる確率を表にまとめました。

不良品の個数確率
00.951
10.048
20.001
30.000
40.000
50.000
60.000
70.000
80.000
90.000
100.000

この表からポアソン分布のグラフを描くと次のようになります。10個の抜き取り検査において不良品が1個も含まれない確率が最も高く、不良品の数が増えるほどその確率は低くなっていることが分かります。また、不良品が2個以上含まれる確率はほとんど0になっています。

図3

前述の例は\lambda=0.05のときに抜き取り検査10個の中に含まれる不良品の個数の確率を表したものでした。次のグラフは、\lambdaの値を1、2、3、5、10にした場合のポアソン分布のグラフです。横軸はある期間に平均して\lambda回起こる現象が実際に起こる回数kを、縦軸はそのときの確率を表します。\lambdaが大きくなるほどグラフは右側へスライドし、右に裾を引いているグラフがだんだん左右対称に近づいていることが分かります。ポアソン分布は、\lambdaが大きくなるにつれて正規分布に近づきます。

図4

[Rのコード]

plot(1:20, dpois(1:20, 1), type="l", ylim=c(0,0.4))
plot(1:20, dpois(1:20, 2), type="l", ylim=c(0,0.4))
plot(1:20, dpois(1:20, 3), type="l", ylim=c(0,0.4))
plot(1:20, dpois(1:20, 5), type="l", ylim=c(0,0.4))
plot(1:20, dpois(1:20, 10), type="l", ylim=c(0,0.4))

【コラム】npとλのイメージ

ポアソン分布のパラメータ「\lambda」についてもう少し詳しく解説します。次の図の青の横線は「ある期間」、赤丸は「その期間内である事象が起こった時」を示しています。ここで「ある期間(青の横線)」を非常に細かく分割します。

図5

すると、分割した1つの期間内である事象が2回起こる確率は0と考えることができます。すなわち、分割した各期間の中で、ある事象が「起こった」か「起こらなかった」かのベルヌーイ試行と考えることができます。分割した期間がn個である場合、ベルヌーイ試行をn回行う二項分布となります。

分割した期間の中である事象が起こる確率をpとすると、二項分布の期待値である「ある期間に起こる事象の平均回数」はE(X)=npと計算できます。このnp\lambda(一定の値)とおき、n \rightarrow \inftyp \rightarrow 0に近づけると、ある期間に平均\lambda回起こる事象がある期間に起こる回数Xが従う分布は「ポアソン分布」となります。

■おすすめ書籍

このあたりの章までの復習にぜひ!

13. いろいろな確率分布1

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)