順列と組み合わせ
2017/08/14
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
順列と組み合わせは高校の数学で学びますが、統計学を理解する上で必須の知識と言えます。Excelにも順列と組み合わせを求めるための関数が用意されています。
PERMUT:順列、permutation
COMBIN:組み合わせ、combination
Excelでは不思議なことに、PERMUTは統計関数、COMBINは数学/三角関数に分類されています。そのため、私もCOMBIN関数は以前から使っていましたが、PERMUT関数には、つい最近まで気がつきませんでした。分類の違いは引数の説明に影響していて、次のような奇妙なことになっています。
PERMUT(標本数,抜き取り数)
COMBIN(総数,抜き取り数)
統計学で標本とは母集団から抜き取ったものですから、「標本数、抜き取り数」と並べられると、いたずらに混乱を招くだけです。
さて、大きさが100個の集団から順番に5個を取り出す場合の並び、順列の数は、
5個をまとめて取り出す場合の組み合わせの数は、
となります。
!は階乗を意味しますが、階乗計算についてもExcelの関数があります。FACT関数です。したがって、Excelに次の2通りの入力した場合、どちらも同じ組み合わせの結果です。
=COMBIN(100,5)
=FACT(100)/(FACT(5)*FACT(100-5))
FACT関数があれば、PERMUもCOMBINも要らないように思えますが、試しに次の式を入力してみてください。
=FACT(200)/(FACT(5)*FACT(200-5))
結果は「#NUM!」になります。計算できない理由は、FACT関数で計算できるのは170の階乗までで、それより大きくなるとExcelの扱える数値の上限を超えて、桁あふれを起こしてしまうからです。COMBIN関数を使って計算すれば「2535650040」と正しい結果を得ることができます。
しかしながら、COMBIN関数にも上限はあります。これをクリアしていくために、統計学では、正規分布やカイ2乗分布などの確率分布を利用します。