- Step1. 基礎編
- 16. 標本と抽出法
16-1. 母集団と標本
日本に住む女性の平均身長を調べる場合について考えます。日本に住む女性は6,521万人(2016年8月時点)いるので、女性全員の身長をすべて測定するのは現実的ではありません。そこで一部の女性の身長のみを測定し、その値を元に日本に住む女性全員の平均身長を推測しようと考えます。こうすれば、日本全国津々浦々に身長計を運ぶ手間も省けますし、何より6,521万人分のデータを分析する必要もありません。
本来知りたいと思っている集団全体のことを「母集団」といいます。ここでは「日本に住む女性全員」が母集団です。一方、母集団の情報を推測するために選ばれた一部の集団のことを「標本」といいます。
母集団から一部を選んで標本とすることを「抽出」といいます。母集団から抽出された標本を用いて、母集団の性質を推測することを「推測統計学」といいます。一方、取得した手元のデータを用いて、データの特徴をグラフや表などを用いて分かりやすく表現することを「記述統計学」といいます。
例えば、日本に住む女性の平均身長を調べるため100人の女性を選んでその身長を測定したとします。この100人のデータを元に日本に住む女性の平均身長を推測することが「推測統計学」です。一方、この100人分のデータを表やグラフにまとめたり、平均値や最大値・最小値を用いてそのデータの持つ特徴をできるだけ簡潔で明確に記述したりすることが「記述統計学」です。
【コラム】有限母集団と無限母集団
母集団には「有限母集団」と「無限母集団」があります。有限母集団は有限の要素からなる母集団のことです。例えば日本に住む女性は非常に多いものの、有限であることから有限母集団です。
一方、無限母集団は無限の要素からなる母集団のことで、例えばさいころを投げて出る目のデータがあてはまります。さいころを投げる実験は無限に繰り返すことができ、得られるデータに限りがありません。
【コラム】有限母集団修正
有限母集団から標本を抽出する場合、標本を抽出するたびに母集団のデータがどんどん減ってしまうために推定値に偏りが出てしまう可能性があります。そこで平均値の分散を求める場合には をかけて「有限母集団修正」を行います。は母集団の大きさを、は抽出するデータの数を表します。
が無限大に近づく場合、となることから、有限母集団における平均値の分散は無限母集団における平均値の分散に一致します。