sample, population, universe―標本と母集団
2017/08/14
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※
ジーニアス英和大辞典によると sample の語源は、中世にイングランドを征服したノルマン人が使っていたアングロノルマン語の assample (見本 = example)。のちに、頭の as が消えて sample になったそうです。さらに遡ると、ラテン語の exemplum に行き着きます。example の原義は、「ex(外へ)+ample(広い)」、「多数の中から取り出されたもの」で、統計学の標本の概念そのものです。
標本( sample )は、母集団の中の1つずつの個体ではなく、母集団の中から抽出した個体の集まりです。Excelの分析ツールを開くとメニューの中に「・・・2標本による検定」というのがありますが、2標本の意味するところは、2個体ということではなく2群(集合)ということです。
また、標本に含まれる個体の数のことをサンプル数と言うのは、厳密には誤りということになります。標本の大きさ、もしくは、サンプルサイズ(sample size)とするのが正しい表現です。エクセル統計でも幾つかの箇所でサンプル数を使ってしまっていますが、次のバージョンで訂正するつもりです。
さて、母集団の英語表現はというと population になります。本来の意味は「人々を住まわせた結果の住民数」です。ラテン語の populare(住まわせる)に由来します。population の一般的な訳は「人口、住民数」ですが、生態学では「個体群」、天文学では「種族」という意味になります。Excelの関数 STDEVP の末尾の P は、population の頭の p ではないかと思います。
さらに、辞典を見ていると母集団の英訳とし て population だけでなく universe (ユニバース。the universe は「宇宙、全人類」という意味)もあります。統計学上の population と universe の違いは、前者が、検定や推定の対象であるところの個体から観測される値(小学校6年生のお小遣い) の集まりであるのに対して、後者は個体(小学校6年生)の集まりという点です。