- Step1. 基礎編
- 16. 標本と抽出法
16-2. 全数調査と標本調査
調査をする時には、調査対象となる母集団を設定した上でデータを取得します。このときに、調査対象となる母集団を全て調べることを「全数調査」といいます。国民全員を調べる「国勢調査」は全数調査の代表例です。一方、調査対象となる母集団の一部を取り出して調べることを「標本調査」といいます。工場での抜き取り検査や街頭アンケートなどの多くは「標本調査」です。
例えば日本に住む女性の平均身長を調べる場合、日本に住む女性全員の身長を測定し、そのデータから平均身長を求める場合が「全数調査」です。しかしながら、日本に住む女性全員の身長を測定するのは現実的ではありません。そこで一部の女性を抽出し、その身長から女性の平均身長を推測する「標本調査」を行うのが一般的です。
標本調査では、元の母集団の正確な推測が目的であるため、母集団からできるだけ偏りがないように調査対象を抽出しなければなりません。このような場合、「単純無作為抽出」という方法で母集団から調査対象を抽出することが基本となります。これは、母集団から「完全に」・「ランダムに」標本を抽出することを意味します。
身長を測定する場合、子供やバレーボール選手ばかりを標本として抽出してしまうと、標本の中に低身長の人あるいは高身長の人が多く含まれてしまうため、その標本から推測される平均身長が母集団の平均身長と大きく乖離してしまう可能性があります。
単純無作為抽出では、母集団の中で誰もが標本として選ばれる確率が等しいことが前提条件であるため、例えば母集団に通し番号を振り、乱数などを発生させることで標本を抽出するという方法が用いられます。
標本の抽出には、次の2種類の方法があります。
- 復元抽出法
- 非復元抽出法
一度抽出された標本を母集団の中に戻す抽出方法です。そのため、一度抽出された調査対象が重複して標本に含まれる可能性があります。
一度抽出された標本は母集団の中に戻さない抽出方法です。そのため、一度抽出された調査対象は重複して標本に含まれることはありません。
母集団が大きく、抽出する標本の大きさが母集団に比べて小さい場合、同一の標本が重複する可能性は低くなるので、これらの2つの方法から推測される値の差は小さくなります。
【コラム】標本の大きさと標本数
統計学では「標本の大きさ」と「標本数」という、似ているようで全く意味の異なる言葉がしばしば登場します。
例えば、日本に住む女性から100人を抽出してアンケートを行うという調査を5回繰り返すとします。このとき「100」を「標本の大きさ」あるいは「サンプルサイズ」と言います。一方で、「5」を「標本数」あるいは「サンプル数」と言います。
16. 標本と抽出法
事前に読むと理解が深まる- 学習内容が難しかった方に -
- ブログ
enquête