BellCurve 統計WEB

  • Step1. 初級編
  • 13. いろいろな確率分布1

13-3. ポアソン分布

■ポアソン分布の"素"となる二項分布

ある交差点で1年間に事故が起こる確率について考えます。これは、事故が起こるか起こらないかのベルヌーイ試行と考えることができます。通過する車10,000台に1件の割合で事故が発生する場合、事故が起こる確率はp=0.0001となります。1年間(n=365)で事故が起こる回数を確率変数Xとすると、k回事故が起こる確率は二項分布の一般式にあてはめて次のように計算できます(ただし、1日に2回以上事故は起こらないものとします)。

     \begin{eqnarray*} \lefteqn{P(X=k)} \\ &=& {}_{n} \mathrm{C}_{k}  p^{k}  (1-p)^{n-k}\\ &=& {}_{365} \mathrm{C}_{k} \times 0.0001^{k} \times (1-0.0001)^{n-k} \hspace{5mm} (k=0,1,2,\cdots,n) \end{eqnarray*}

二項分布では、確率変数Xの期待値はE(X)=npによって求められることは13-2章で既に学びました。npはある事象が起こる平均回数を表します。

■ポアソン分布

この事故の例のように、nが十分大きく確率pが非常に小さい場合、「np=一定」と考えることができます。そこでnpを「\lambda(ラムダ)」とおくと、事故が起こる回数Xは「ポアソン分布」に従うと考えることができます。ポアソン分布は「ある期間に平均\lambda 回起こる現象が、ある期間にX回起きる確率の分布」と言い換えられます。

図1

Xがポアソン分布に従うとき、「X \sim Po(\lambda)」と書きます。\lambdaがポアソン分布でのパラメータです。確率変数Xがポアソン分布に従う場合、ある期間に平均\lambda回起こる現象がk回起こる確率、すなわちX=kとなる確率は次の式から計算できます。

     \begin{eqnarray*}  P(X=k)= \displaystyle\frac{e^{-\lambda} \lambda^{k}}{k!} & (k=0,1,2, \cdots ,n) \\ \end{eqnarray*}

e」は「ネイピア数」あるいは「自然対数の底」と呼ばれる定数で、「e=2.7182818 \cdots」という無限に続く値をもちます。

例題:

製品Aを作る工場では平均して200個に1個の割合で不良品が発生します。製造された製品Aを10個抜き取る時、この中に不良品が含まれる個数Xがポアソン分布に従うとすると、不良品が1個含まれる(X=1となる)確率はいくらでしょうか。

図2

不良品が発生する確率は\displaystyle p=\frac{1}{200}、抜き取り検査をした個数はn=10であることから、

 \displaystyle \lambda=np=10\times \frac{1}{200}=0.05

となります。したがって、

  P(X=1)= \displaystyle\frac{e^{-\lambda} \lambda^{k}}{k!}= \displaystyle \frac{e^{-0.05} \times 0.05^{1}}{1!}=0.048

と計算され、10個の抜き取り検査で不良品が1個含まれる確率は約4.8%となります。

■ポアソン分布のグラフ

同様の計算を行い、この製品Aの10個の抜取検査においてX個の不良品が含まれる確率を表にまとめました。

不良品の個数確率
00.951
10.048
20.005
30.001
40.000
50.000
60.000
70.000
80.000
90.000
100.000

この表からポアソン分布のグラフを描くと次のようになります。10個の抜取調査において不良品が1個も含まれない確率が最も高く、不良品の数が増えるほどその確率は低くなっていることが分かります。また、不良品が2個以上含まれる確率はほとんど0になっています。

図3

前述の例は\lambda=0.05のときに抜取調査10個の中に含まれる不良品の個数の確率を表したものでした。次のグラフは、\lambdaの値を1、2、3、5、10にした場合のポアソン分布のグラフです。横軸はある期間に平均して\lambda回起こる現象が実際に起こる回数kを、縦軸はそのときの確率を表します。\lambdaが大きくなるほどグラフは右側へスライドし、右に裾を引いているグラフがだんだん左右対称に近づいていることが分かります。ポアソン分布は、\lambdaが大きくなるにつれて正規分布に近づきます。

図4

【コラム】npとλのイメージ

ポアソン分布のパラメータ「\lambda」についてもう少し詳しく解説します。次の図の青の横線は「ある期間」、赤丸は「その期間内である事象が起こった時」を示しています。ここで「ある期間(青の横線)」を非常に細かく分割します。

図5

すると、分割した1つの期間内である事象が2回起こる確率は0と考えることができます。すなわち、分割した各期間の中で、ある事象が「起こった」か「起こらなかった」かのベルヌーイ試行と考えることができます。分割した期間がn個であれば場合、ベルヌーイ試行をn回行う二項分布となります。

分割した期間の中である事象が起こる確率をpとすると、二項分布の期待値である「ある期間に起こる事象の平均回数」はE(X)=npと計算できます。このnp\lambda(一定の値)とおき、n \rightarrow \inftyp \rightarrow 0に近づけると、ある期間に平均\lambda回起こる事象がある期間に起こる回数Xが従う分布は「ポアソン分布」となります。

13. いろいろな確率分布1

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。