- Step1. 基礎編
- 13. いろいろな確率分布1
13-7. 超幾何分布
■超幾何分布
AとBで構成される個からなる集団があり、Aが
個、Bが
個であるとします。この集団から取り出された
個の中に含まれるAの個数が従う確率分布を「超幾何分布(ちょうきかぶんぷ)」といいます。確率変数が超幾何分布に従う場合、取り出されたAが
個である確率(
となる確率)は次の式から計算できます。
![Rendered by QuickLaTeX.com \displaystyle P(X=k)= \frac{_{M}C_{k} \times _{N-M}C_{n-k}}{_{N}C_{n}}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-445c562b60face7f0ad5de9eef40e07a_l3.png)
ただし、は次の条件を満たします。
![Rendered by QuickLaTeX.com \displaystyle \max(0,\ n - (N - M)) \leq k \leq \min(n,\ M)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-d42a65b29147921179f425e1452e7a79_l3.png)
例えば、赤い玉が8個と白い玉が5個入った袋から3つの玉を取り出したときに、3つのうち2つが赤色の玉である確率は次のように計算できます。
![Rendered by QuickLaTeX.com \displaystyle P(X=2)= \frac{_{8}C_{2} \times _{5}C_{1}}{_{13}C_{3}} = \frac{70}{143}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-565b09b822b4a62946083c7a080d301d_l3.png)
![](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2022/03/795316b92fc766b0181f6fef074f03fa.png)
■例題1:
ある湖に魚が100匹います。このうち、20匹の魚を捕獲して尾びれに印をつけて湖に戻しました。この湖から5匹の魚を捕獲したとき、尾びれに印がついた魚が1匹だけ含まれる確率はいくらでしょうか。
![](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2022/03/2b530e80c7d0de90885e285c5d798063.png)
全体の魚の数は、印がついた魚の数は
、印がついていない魚の数は
、捕獲した魚の数は
であることから、
![Rendered by QuickLaTeX.com \displaystyle P(X=1)= \frac{_{20}C_{1} \times _{80}C_{4}}{_{100}C_{5}} = 0.420](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-45049c563bd09d8dad3657d81f1e1a84_l3.png)
と計算され、尾びれに印がついた魚が1匹だけ含まれる確率は約42.0%となります。
■例題2:
ある湖にいる魚を100匹捕獲して尾びれに印をつけて湖に戻しました。この湖から20匹の魚を捕獲したとき、尾びれに印がついた魚が5匹含まれていました。このとき、湖全体には何匹の魚がいると推定できるでしょうか。
![](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2022/03/c8856789ec11ab8b1013037cef6929f9.png)
捕獲した20匹の魚のうち、印がついた魚は5匹でした。つまり、ランダムに捕獲した魚の5/20=1/4には印がついていることが予想されます。湖全体の魚についても同様の割合で印がついていることが予想されることから、湖全体の魚の数をとすると
![Rendered by QuickLaTeX.com \displaystyle x \times \frac{1}{4} = 100](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-bab8137e7c131f6173b16944a899ffc8_l3.png)
という式を立てることができます。これを解いてとなり、湖には400匹の魚がいると推定できます。
このように、一部の個体を捕獲して印をつけ、再度捕獲したときの印の数をもとに全体の個体数を推定する方法を「捕獲再捕獲法」といいます。ある領域や地域に住む生物の個体数を推定するときに使われます。ただし、ほとんど移動しない生物や個体数が変化する生物に対して個体数の推定を行う場合には、捕獲再捕獲法は適していません。
■超幾何分布の期待値と分散
確率変数が超幾何分布に従っている時、その期待値
と分散
は以下のようになります。
![Rendered by QuickLaTeX.com \displaystyle E(X)=n \cdot \frac{M}{N}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-34b11b7b580b97b066c030ba04576d14_l3.png)
![Rendered by QuickLaTeX.com \displaystyle V(X)=n \cdot \frac{M(N-M)}{N^2} \cdot \frac{N-n}{N-1}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-24c23c59b65d864377a014c135814394_l3.png)
超幾何分布は、2つの性質で構成される集団から非復元抽出法でサンプルを採取した場合の確率分布です。復元抽出法の場合には(一定)とおくことができます。このとき、期待値と分散は
![Rendered by QuickLaTeX.com \displaystyle E(X)=n \cdot \frac{M}{N} = np](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-1f8ec1675a95304348d462fb042abe0e_l3.png)
![Rendered by QuickLaTeX.com \displaystyle V(X)=n \cdot \frac{M(N-M)}{N^2} \cdot \frac{N-n}{N-1} = np(1-p) \cdot \frac{N-n}{N-1}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-0c56cdb5adb56a03c368a985bcc811cc_l3.png)
となります。が無限に大きい場合(
)には
![Rendered by QuickLaTeX.com \displaystyle V(X)=n \cdot \frac{M(N-M)}{N^2} \cdot \frac{N-n}{N-1} = np(1-p) \cdot \frac{N-n}{N-1} = np(1-p)](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-f131d72403e93d820f02074495e869ba_l3.png)
となり、二項分布における期待値と分散に等しくなります。つまり、(一定)であり
が無限に大きい場合(
)には、超幾何分布は二項分布に近似できます。