BellCurve 統計WEB

  • Step1. 基礎編
  • 13. いろいろな確率分布1

13-7. 超幾何分布

■超幾何分布

AとBで構成されるN個からなる集団があり、AがM個、BがN-M個であるとします。この集団から取り出されたn個の中に含まれるAの個数が従う確率分布を「超幾何分布(ちょうきかぶんぷ)」といいます。確率変数が超幾何分布に従う場合、取り出されたAがk個である確率(X=kとなる確率)は次の式から計算できます。

 \displaystyle P(X=k)= \frac{_{M}C_{k} \times _{N-M}C_{n-k}}{_{N}C_{n}}

ただし、kは次の条件を満たします。

 \displaystyle \max(0,\ n - (N - M)) \leq k \leq \min(n,\ M)

例えば、赤い玉が8個と白い玉が5個入った袋から3つの玉を取り出したときに、3つのうち2つが赤色の玉である確率は次のように計算できます。

 \displaystyle P(X=2)= \frac{_{8}C_{2} \times _{5}C_{1}}{_{13}C_{3}} = \frac{70}{143}

■例題1:

ある湖に魚が100匹います。このうち、20匹の魚を捕獲して尾びれに印をつけて湖に戻しました。この湖から5匹の魚を捕獲したとき、尾びれに印がついた魚が1匹だけ含まれる確率はいくらでしょうか。

全体の魚の数はN=100、印がついた魚の数はM=20、印がついていない魚の数はN-M=80、捕獲した魚の数はn=5であることから、

 \displaystyle P(X=1)= \frac{_{20}C_{1} \times _{80}C_{4}}{_{100}C_{5}} = 0.420

と計算され、尾びれに印がついた魚が1匹だけ含まれる確率は約42.0%となります。

■例題2:

ある湖にいる魚を100匹捕獲して尾びれに印をつけて湖に戻しました。この湖から20匹の魚を捕獲したとき、尾びれに印がついた魚が5匹含まれていました。このとき、湖全体には何匹の魚がいると推定できるでしょうか。

捕獲した20匹の魚のうち、印がついた魚は5匹でした。つまり、ランダムに捕獲した魚の5/20=1/4には印がついていることが予想されます。湖全体の魚についても同様の割合で印がついていることが予想されることから、湖全体の魚の数をxとすると

 \displaystyle x \times \frac{1}{4} = 100

という式を立てることができます。これを解いてx=400となり、湖には400匹の魚がいると推定できます。

このように、一部の個体を捕獲して印をつけ、再度捕獲したときの印の数をもとに全体の個体数を推定する方法を「捕獲再捕獲法」といいます。ある領域や地域に住む生物の個体数を推定するときに使われます。ただし、ほとんど移動しない生物や個体数が変化する生物に対して個体数の推定を行う場合には、捕獲再捕獲法は適していません。

■超幾何分布の期待値と分散

確率変数X超幾何分布に従っている時、その期待値E(X)分散V(X)は以下のようになります。

 \displaystyle E(X)=n \cdot \frac{M}{N}
 \displaystyle V(X)=n \cdot \frac{M(N-M)}{N^2} \cdot \frac{N-n}{N-1}

超幾何分布は、2つの性質で構成される集団から非復元抽出法でサンプルを採取した場合の確率分布です。復元抽出法の場合にはM/N=p(一定)とおくことができます。このとき、期待値と分散は

 \displaystyle E(X)=n \cdot \frac{M}{N} = np
 \displaystyle V(X)=n \cdot \frac{M(N-M)}{N^2} \cdot \frac{N-n}{N-1} = np(1-p) \cdot \frac{N-n}{N-1}

となります。Nが無限に大きい場合(N \rightarrow \infty)には

 \displaystyle V(X)=n \cdot \frac{M(N-M)}{N^2} \cdot \frac{N-n}{N-1} = np(1-p) \cdot \frac{N-n}{N-1} = np(1-p)

となり、二項分布における期待値と分散に等しくなります。つまり、M/N=p(一定)でありNが無限に大きい場合(N \rightarrow \infty)には、超幾何分布は二項分布に近似できます。

13. いろいろな確率分布1


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)