BellCurve 統計WEB

未経験からデータ分析が学べる
卒業後の追加講座も永年見放題

ブログ


令和元年 公認会計士試験論文式試験(統計学)第8問 問題1

2021/06/21

カテゴリ:

下記のリンクからそれぞれの問題の解説に飛ぶことができます。

問1

【ア】母集団から「完全に」・「ランダムに」標本を抽出することを「単純無作為抽出」といいます。

【イ】これは中心極限定理に関する問題です。中心極限定理は、平均\mu、分散\sigma^2に従う母集団からサンプルサイズnの標本を抽出する場合、その平均値の分布はnが大きくなるにつれて正規分布N(\mu, \sigma^2/n)に近づくというものです。したがって、標本平均\bar{X}の期待値はE(\bar{X})=\muとなります。

【ウ】【エ】こちらも中心極限定理から、標本平均\bar{X}の分散はV(\bar{X})=\sigma^2/nとなります。ただし、有限母集団から標本を抽出する場合、標本を抽出するたびに母集団のデータがどんどん減ってしまうために推定値に偏りが出てしまう可能性があります。そこで(N-n)/(N-1)をかけて「有限母集団修正」を行います。

【オ】母集団をあらかじめいくつかの層(グループ)に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法を「層化抽出法」もしくは「層別抽出法」といいます。

【カ】iグループのj番目のサンプルの値をx_{ij}とおきます。問題文より

 \displaystyle \bar{X_s} = \sum_{i=1}^{L} \frac{N_i}{N}\bar{X_i} = \sum_{i=1}^{L} \frac{N_i}{N}\frac{1}{n_i}\sum_{j=1}^{n_i}x_{ij}

ここで、\displaystyle \frac{1}{n_i}\sum_{j=1}^{n_i}x_{ij}の期待値は\displaystyle \frac{1}{N_i}\sum_{j=1}^{N_i}x_{ij}となるので、

 \displaystyle E(\bar{X_s}) = \sum_{i=1}^{L} \frac{N_i}{N}\frac{1}{N_i}\sum_{j=1}^{N_i}x_{ij} = \frac{1}{N}\sum_{i=1}^{L}\sum_{j=1}^{N_i}x_{ij}

となります。この式より、E(\bar{X_s})は次のようになります。

 \displaystyle E(\bar{X_s}) = \mu

【キ】【ク】\frac{N_i}{N}\bar{X_i}は互いに独立なので、

 \displaystyle Var(\bar{X_s}) = Var\left(\sum_{i=1}^{L} \frac{N_i}{N}\bar{X_i}\right) = \sum_{i=1}^{L} Var\left(\frac{N_i}{N}\bar{X_i}\right) = \sum_{i=1}^{L} \frac{N^2_i}{N^2}Var\left(\bar{X_i}\right)

問題文の上の方でVar(\bar{X})の式が算出されているのでこの式を使うと、

 \displaystyle \sum_{i=1}^{L} \frac{N^2_i}{N^2}Var\left(\bar{X_i}\right) = \sum_{i=1}^{L} \frac{N^2_i}{N^2} \times \frac{N_i-n_i}{N_i-1} \times \frac{\sigma_i^2}{n_i}

となります。

問2

「1~9人」の場合

 \displaystyle 2000 \times \frac{500}{40000} = 25

「10~99人」の場合

 \displaystyle 2000 \times \frac{4500}{40000} = 225

「100~999人」の場合

 \displaystyle 2000 \times \frac{20000}{40000} = 1000

「1000人以上」の場合

 \displaystyle 2000 \times \frac{15000}{40000} = 750

問1より\bar{X_s}の分散Var(\bar{X_s})

 \displaystyle Var(\bar{X_s}) = \sum_{i=1}^{4} \frac{N^2_i}{N^2} \times \frac{N_i-n_i}{N_i-1} \times \frac{\sigma_i^2}{n_i}
 = \displaystyle \frac{500^2}{40000^2} \times \frac{500-25}{500-1} \times \frac{100}{25} + \frac{4500^2}{40000^2} \times \frac{4500-225}{4500-1} \times \frac{225}{225} + \frac{20000^2}{40000^2} \times \frac{20000-1000}{20000-1} \times \frac{400}{1000} + \frac{15000^2}{40000^2} \times \frac{15000-750}{15000-1} \times \frac{625}{750}
 = 0.00059494 + 0.01202611 + 0.09500475 + 0.111335547 = 0.218961347

となります。この値の平方根を取ることで標準誤差となります。

 \displaystyle \sqrt{0.218961347} = 0.468

問3

問1より

 \displaystyle E(\bar{X_s}) = \mu

であることから、\bar{X_s}は不偏推定値です。したがって、求める値は、

 \displaystyle \bar{X_s} = \sum_{i=1}^{4} \frac{N_i}{N}\bar{X_i}
 = \displaystyle \frac{500}{40000} \times \frac{625}{25} + \frac{4500}{40000} \times \frac{6750}{225} + \frac{20000}{40000} \times \frac{35000}{1000} + \frac{15000}{40000} \times \frac{30000}{750} = 36.19

となります。



統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)