BellCurve 統計WEB

最大55万円の給付金還付
未経験からデータ分析が学べる

ブログ


統計検定2級CBT公式問題集の解説(標本分布の分野)

2023/09/16

カテゴリ:

※統計検定2級 解説記事一覧はこちら


下記のリンクからそれぞれの問題の解説に飛ぶことができます。

問1

\hat{p} を標準化するには、\hat{p} から p を引いたものを \sqrt{\frac{p(1-p)}{n}} で割ります。標準化した式を用いて95%信頼区間を求めると、

 \displaystyle -1.96 \leq \frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq 1.96

となります。変形すると、

 \displaystyle -1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq \hat{p}-p \leq 1.96 \times \sqrt{\frac{p(1-p)}{n}}
 \displaystyle -1.96 \times \sqrt{\frac{p(1-p)}{n}} - \hat{p} \leq -p \leq 1.96 \times \sqrt{\frac{p(1-p)}{n}} - \hat{p}
 \displaystyle 1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p} \geq p \geq -1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p}
 \displaystyle -1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p} \leq p \leq 1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p}
 \displaystyle \hat{p} -1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq p \leq \hat{p} + 1.96 \times \sqrt{\frac{p(1-p)}{n}}

となります。


標本比率を用いた母比率の信頼区間算出の詳細については「21-1. 母比率の信頼区間の求め方1」をご覧ください。

問2

母集団{2, 4, 6, 8}から大きさ2の標本を無作為復元抽出する場合のすべてのパターンは次のようになります。復元抽出なので、1回目に抽出した値(左側の値)と2回めに抽出した値(右側の値)を区別する必要があるところがポイントです。

  • (2, 2), (2, 4), (2, 6), (2, 8)
  • (4, 2), (4, 4), (4, 6), (4, 8)
  • (6, 2), (6, 4), (6, 6), (6, 8)
  • (8, 2), (8, 4), (8, 6), (8, 8)

それぞれのパターンにおける標本平均 \bar{X} は次のようになります。

  • (2, 2)=2, (2, 4)=3, (2, 6)=4, (2, 8)=5
  • (4, 2)=3, (4, 4)=4, (4, 6)=5, (4, 8)=6
  • (6, 2)=4, (6, 4)=5, (6, 6)=6, (6, 8)=7
  • (8, 2)=5, (8, 4)=6, (8, 6)=7, (8, 8)=8

標本平均 \bar{X} の値と頻度を整理すると

標本平均パターン頻度
2(2, 2)1
3(2, 4), (4, 2)2
4(2, 6), (4, 4), (6, 2)3
5(2, 8), (4, 6), (6, 4), (8, 2)4
6(4, 8), (6, 6), (8, 4)3
7(6, 8), (8, 6)2
8(8, 8)1

となります。この表から、中央値、最頻値ともに5であることが分かります。

問3

問題文より XY の差を2で割ることでBの重さを推定することができます。

 \displaystyle \frac{X-Y}{2} = \frac{a+b+\epsilon_1 -(a-b+\epsilon_2)}{2} = b+\frac{\epsilon_1-\epsilon_2}{2}

コインBの重さの重さの推定量は b であり、その誤差は\displaystyle \frac{\epsilon_1-\epsilon_2}{2} です。問題文より、\epsilon_1\epsilon_2 の分布は独立であることから、コインBの重さの重さの推定量の分散は

 \displaystyle V \left[ \frac{X-Y}{2} \right] = V \left[ \frac{X}{2} \right] + V \left[ \frac{Y}{2} \right] = \frac{\sigma^2}{4} + \frac{\sigma^2}{4} = \frac{\sigma^2}{2}

となります。


2変数の分散については「15-6. 2変数の期待値と分散」をご覧ください。

問4

UV の平均を計算してみます。

 \displaystyle E[U] = E[X+Y] = E[X] + E[Y] = 0 + 0 = 0
 \displaystyle E[V] = E[X-Y] = E[X] - E[Y] = 0 - 0 = 0

次に、UV の分散を計算してみます。UV は互いに独立であることから、

 \displaystyle V[U] = V[X+Y] = V[X] + V[Y] = \sigma^2_1 + \sigma^2_2
 \displaystyle V[V] = V[X-Y] = V[X] + V[Y] = \sigma^2_1 + \sigma^2_2

となります。最後に、UV の共分散を計算してみます。

     \begin{eqnarray*} \displaystyle Cov(U, V) &=& E[(U-E[U])(V-E[V])] \\ &=& E[((X+Y)-E[X+Y])((X-Y)-E[X-Y])] \\ &=& E[(X+Y)(X-Y)-(X+Y)E[X-Y] \\ &-& E[X+Y](X-Y)+E[X+Y]E[X-Y])] \\ &=& E[(X+Y)(X-Y)] - E[X+Y]E[X-Y] \\  &-& E[X+Y]E[X-Y] + E[X+Y]E[X-Y] \\ &=& E[X^2-Y^2] - E[X+Y]E[X-Y] \\ &=& E[X^2] - E[Y^2] - (E[X] + E[Y])(E[X] - E[Y]) \\ &=& E[X^2] - E[Y^2] - ((E[X])^2 - (E[Y])^2) \\ &=& E[X^2] - (E[X])^2 - (E[Y^2]  - (E[Y])^2 \\ \end{eqnarray*}

ここで分散の定義より

 \displaystyle V[X] = E[X^2] - (E[X])^2

であることから、

     \begin{eqnarray*} \displaystyle Cov(U, V) &=& E[X^2] - (E[X])^2 - (E[Y^2]  - (E[Y])^2 \\ &=& V[X] - V[Y] \\ &=& \sigma^2_1 - \sigma^2_2 \\ \end{eqnarray*}

となります。


I:
UV の平均の計算結果より、正しいことがわかります。

II:
共分散 Cov(U,V) が0の場合、UV は互いに独立であるといえます。UV の共分散の計算結果より、Cov(U, V)=\sigma^2_1 - \sigma^2_2 となります。この値が0になるのは \sigma^2_1 = \sigma^2_2 の場合です。

III:
UV の平均と分散の計算結果より、どちらも平均が0、分散が \sigma^2_1 = \sigma^2_2 の正規分布に従います。

問5

母平均を \mu、標本平均を \bar{X}、標本から算出した不偏分散を S^2、サンプルサイズを n とすると、次に示す統計量 T の値は、自由度 (t-1) の t分布に従います。

 \displaystyle T = \frac{\bar{X} - \mu}{\sqrt{\frac{S^2}{n}}}

したがって、問題文で与えられた T は自由度 8t分布に従います。ここで、

     \begin{eqnarray*} \displaystyle P(\bar{X} \geq \mu + 0.62S) &\Leftrightarrow& P(\bar{X}- \mu \geq 0.62S) \\ &\Leftrightarrow& P\left(\frac{\bar{X}- \mu}{S} \geq 0.62\right) \\ &\Leftrightarrow& P\left(\frac{\bar{X}- \mu}{\sqrt{S^2}} \geq 0.62\right) \\ &\Leftrightarrow& P\left(\frac{\bar{X}- \mu}{\sqrt{S^2}} \times \sqrt{9} \geq 0.62 \times \sqrt{9}\right) \\ &\Leftrightarrow& P\left(\frac{\bar{X}- \mu}{\sqrt{\frac{S^2}{9}}} \geq 0.62 \times 3\right) \\ &\Leftrightarrow& P\left(\frac{\bar{X}- \mu}{\sqrt{\frac{S^2}{9}}} \geq 1.86\right) \\ &\Leftrightarrow& P(T \geq 1.86) \\ \end{eqnarray*}

と変形できます。t分布表から自由度8の行を見ると、上側確率が 0.05 となる点が 1.86 であることがわかります。すなわち、

 \displaystyle P(T \geq 1.86)

となる確率は0.05となります。


t分布の詳細については「20-1. 標本とt分布」をご覧ください。

問6

問題文より、確率変数 X_1X_2X_3 はいずれも標準化されていることから、

 \displaystyle E[X_1] = E[X_2] = E[X_3] = 0
 \displaystyle V[X_1] = V[X_2] = V[X_3] = 1

となります。また、確率変数 XY の相関係数 r は次の式から算出できます。

 \displaystyle r = \frac{Cov(X,Y)}{\sqrt{V[X]V[Y]}}

X_1X_2 との相関係数は0.5であることから

 \displaystyle \frac{Cov(X_1,X_2)}{\sqrt{V[X_1]V[X_2]}} = \frac{Cov(X_1,X_2)}{\sqrt{1 \times 1}} = Cov(X_1,X_2) = 0.5

となります。同様に計算すると、

 \displaystyle Cov(X_1,X_2) = Cov(X_2,X_3) = Cov(X_1,X_3) = 0.5 = \frac{1}{2}

となります。X_1Y との相関係数は

     \begin{eqnarray*} \displaystyle r &=& \frac{Cov(X_1,Y)}{\sqrt{V[X_1]V[Y]}} \\ &=& \frac{Cov \left( X_1,\frac{X_1 + X_2 + X_3}{3} \right) }{\sqrt{1 \times V \left[\frac{X_1 + X_2 + X_3}{3} \right]}} \\ &=& \frac{\frac{Cov(X_1,X_1) + Cov(X_1,X_2) + Cov(X_1,X_3)}{3} }{\sqrt{V \left[ \frac{X_1 + X_2 + X_3}{3} \right]}} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3} Cov(X_1, X_2) + \frac{1}{3} Cov(X_1, X_3) }{A} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3} \times \frac{1}{2} + \frac{1}{3} \times \frac{1}{2} }{\sqrt{\frac{1}{9} \times \left(1 + 1 + 1 + 2 \times \frac{1}{2} + 2 \times \frac{1}{2} + 2 \times \frac{1}{2} \right)}} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{2}{6}}{\sqrt{\frac{6}{9}}} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3}}{\sqrt{\frac{2}{3}}} \\ \end{eqnarray*}

ただし、A=\sqrt{\frac{1}{9} \times (V[X_1] + V[X_2] + V[X_3] + 2Cov(X_1,X_2) + 2Cov(X_2,X_3) + 2Cov(X_1,X_3))} である。ここで X_1X_1 の相関係数が1であることを利用すると、

 \displaystyle \frac{Cov(X_1,X_1)}{\sqrt{V[X_1]V[X_1]}} = \frac{Cov(X_1,X_1)}{\sqrt{1 \times 1}} = Cov(X_1,X_1) = 1

となることから、上の式に代入すると

     \begin{eqnarray*} \displaystyle r &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3}}{\sqrt{\frac{2}{3}}} \\ &=& \frac{\frac{1}{3} \times 1 + \frac{1}{3}}{\sqrt{\frac{2}{3}}} \\ &=& \frac{\frac{2}{3}}{\sqrt{\frac{2}{3}}} \\ &=& \sqrt{\frac{2}{3}} \\ &=& \frac{1.41}{1.73} \\ &=& 0.82 \\ \end{eqnarray*}

となります。


共分散の詳細については「15-6. 2変数の期待値と分散」をご覧ください。

問7

問題文より

 \displaystyle E[X] = \mu
 \displaystyle V[X] = \sigma^2

となります。分散は次のように計算することができます。

 \displaystyle V[X] = E[X^2] - (E[X])^2

この式を利用すると、

 \displaystyle \sigma^2 = E[X^2] - \mu^2
 \displaystyle E[X^2] = \sigma^2 + \mu^2

となります。


確率変数の分散の詳細については「12-5. 確率変数の分散」をご覧ください。

問8

さまざまな確率分布の定義をまとめてみます。

  • カイ二乗分布
  • Z_{1}, Z_{2}, …, Z_{k} が互いに独立で標準正規分布 N(0, 1) に従う確率変数であるとき、次の式から算出される\chi^{2} は自由度 k のカイ二乗分布に従います。

     \displaystyle \chi^{2}=Z_{1}^{2}+Z_{2}^{2}+\cdots+Z_{k}^{2}

    自由度が1のとき、カイ二乗分布は標準正規分布に従う確率変数を二乗したものに等しくなります。

     \displaystyle \chi^{2}(1)=Z_{1}^{2}
  • t分布
  • 標準正規分布 N(0, 1) に従う Z と自由度 n のカイ二乗分布 W があり、これらが互いに独立であるとき、次の式から算出される t は自由度 n のt分布に従います。

     \displaystyle t=\frac{Z}{\sqrt{\frac{W}{n}}}
  • F分布
  • F分布は、自由度が k_{1}k_{2} のカイ二乗分布 \chi_{1}\sim \chi^{2} (k_{1})\chi_{2} \sim \chi^{2} (k_{2}) が互いに独立である場合に、次の式から算出されるFが従う確率分布のことです。このときFは自由度 (k_{1}, k_{2}) のF分布に従います。

     \displaystyle F=\frac{\chi_{1}^{2} / k_{1}}{\chi_{2}^{2} / k_{2}}

これらの定義を問題文で与えられた数式に照らし合わせてみます。定義より、T は自由度5のカイ二乗分布に従います。また、V は自由度5のt分布に従います。W は次のように書き換えることができます。

 \displaystyle W = \frac{T/5}{Z_1^2} = \frac{\chi^{2}(5)/5}{\chi^{2}(1)/1}

この式から、W は自由度(5, 1)のF分布に従うことが分かります。


次に \alpha を計算します。V は自由度5のt分布に従うことから、P(|V| \geq 1/\sqrt{\alpha})=0.05 の値を計算するためには、t分布表の自由度5の行から上側2.5%点となる値が必要です(|V|となっているので、上側と下側合わせて0.05 (5%) となる確率を計算します)。t分布表を見ると「2.571」となっているので、

 \displaystyle \frac{1}{\alpha} = 2.571

となることから、これを解いて \alpha=0.151 となります。


カイ二乗分布の詳細については「22-1. カイ二乗分布」を、t分布の詳細については「20-1. 標本とt分布」を、F分布の詳細については「28-1. F分布」をご覧ください。



統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)