統計検定2級CBT公式問題集の解説（標本分布の分野）

2023/09/16

カテゴリ：統計検定

※統計検定2級解説記事一覧はこちら※

下記のリンクからそれぞれの問題の解説に飛ぶことができます。

問1：標本割合 $\hat{p}$ の標本分布に関する問題
問2：標本分布の中央値等に関する問題
問3：推定量の分散に関する問題
問4：和と差の確率変数の性質に関する問題
問5：t分布の確率計算に関する問題
問6：分散・共分散・相関係数に関する問題
問7： $X^2$ の期待値に関する問題
問8：F分布の特徴付けに関する問題

問1

$\hat{p}$ を標準化するには、 $\hat{p}$ から $p$ を引いたものを $\sqrt{\frac{p(1-p)}{n}}$ で割ります。標準化した式を用いて95%信頼区間を求めると、

$\displaystyle -1.96 \leq \frac{\hat{p}-p}{\sqrt{\frac{p(1-p)}{n}}} \leq 1.96$

となります。変形すると、

$\displaystyle -1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq \hat{p}-p \leq 1.96 \times \sqrt{\frac{p(1-p)}{n}}$

$\displaystyle -1.96 \times \sqrt{\frac{p(1-p)}{n}} - \hat{p} \leq -p \leq 1.96 \times \sqrt{\frac{p(1-p)}{n}} - \hat{p}$

$\displaystyle 1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p} \geq p \geq -1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p}$

$\displaystyle -1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p} \leq p \leq 1.96 \times \sqrt{\frac{p(1-p)}{n}} + \hat{p}$

$\displaystyle \hat{p} -1.96 \times \sqrt{\frac{p(1-p)}{n}} \leq p \leq \hat{p} + 1.96 \times \sqrt{\frac{p(1-p)}{n}}$

となります。

標本比率を用いた母比率の信頼区間算出の詳細については「21-1. 母比率の信頼区間の求め方1」をご覧ください。

問2

母集団｛2, 4, 6, 8｝から大きさ2の標本を無作為復元抽出する場合のすべてのパターンは次のようになります。復元抽出なので、1回目に抽出した値（左側の値）と2回めに抽出した値（右側の値）を区別する必要があるところがポイントです。

(2, 2), (2, 4), (2, 6), (2, 8)
(4, 2), (4, 4), (4, 6), (4, 8)
(6, 2), (6, 4), (6, 6), (6, 8)
(8, 2), (8, 4), (8, 6), (8, 8)

それぞれのパターンにおける標本平均 $\bar{X}$ は次のようになります。

(2, 2)=2, (2, 4)=3, (2, 6)=4, (2, 8)=5
(4, 2)=3, (4, 4)=4, (4, 6)=5, (4, 8)=6
(6, 2)=4, (6, 4)=5, (6, 6)=6, (6, 8)=7
(8, 2)=5, (8, 4)=6, (8, 6)=7, (8, 8)=8

標本平均 $\bar{X}$ の値と頻度を整理すると

標本平均	パターン	頻度
2	(2, 2)	1
3	(2, 4), (4, 2)	2
4	(2, 6), (4, 4), (6, 2)	3
5	(2, 8), (4, 6), (6, 4), (8, 2)	4
6	(4, 8), (6, 6), (8, 4)	3
7	(6, 8), (8, 6)	2
8	(8, 8)	1

となります。この表から、中央値、最頻値ともに5であることが分かります。

問3

問題文より $X$ と $Y$ の差を2で割ることでBの重さを推定することができます。

$\displaystyle \frac{X-Y}{2} = \frac{a+b+\epsilon_1 -(a-b+\epsilon_2)}{2} = b+\frac{\epsilon_1-\epsilon_2}{2}$

コインBの重さの重さの推定量は $b$ であり、その誤差は $\displaystyle \frac{\epsilon_1-\epsilon_2}{2}$ です。問題文より、 $\epsilon_1$ と $\epsilon_2$ の分布は独立であることから、コインBの重さの重さの推定量の分散は

$\displaystyle V \left[ \frac{X-Y}{2} \right] = V \left[ \frac{X}{2} \right] + V \left[ \frac{Y}{2} \right] = \frac{\sigma^2}{4} + \frac{\sigma^2}{4} = \frac{\sigma^2}{2}$

となります。

2変数の分散については「15-6. 2変数の期待値と分散」をご覧ください。

問4

$U$ と $V$ の平均を計算してみます。

$\displaystyle E[U] = E[X+Y] = E[X] + E[Y] = 0 + 0 = 0$

$\displaystyle E[V] = E[X-Y] = E[X] - E[Y] = 0 - 0 = 0$

次に、 $U$ と $V$ の分散を計算してみます。 $U$ と $V$ は互いに独立であることから、

$\displaystyle V[U] = V[X+Y] = V[X] + V[Y] = \sigma^2_1 + \sigma^2_2$

$\displaystyle V[V] = V[X-Y] = V[X] + V[Y] = \sigma^2_1 + \sigma^2_2$

となります。最後に、 $U$ と $V$ の共分散を計算してみます。

$\begin{eqnarray*} \displaystyle Cov(U, V) &=& E[(U-E[U])(V-E[V])] \\ &=& E[((X+Y)-E[X+Y])((X-Y)-E[X-Y])] \\ &=& E[(X+Y)(X-Y)-(X+Y)E[X-Y] \\ &-& E[X+Y](X-Y)+E[X+Y]E[X-Y])] \\ &=& E[(X+Y)(X-Y)] - E[X+Y]E[X-Y] \\ &-& E[X+Y]E[X-Y] + E[X+Y]E[X-Y] \\ &=& E[X^2-Y^2] - E[X+Y]E[X-Y] \\ &=& E[X^2] - E[Y^2] - (E[X] + E[Y])(E[X] - E[Y]) \\ &=& E[X^2] - E[Y^2] - ((E[X])^2 - (E[Y])^2) \\ &=& E[X^2] - (E[X])^2 - (E[Y^2] - (E[Y])^2 \\ \end{eqnarray*}$

ここで分散の定義より

$\displaystyle V[X] = E[X^2] - (E[X])^2$

であることから、

$\begin{eqnarray*} \displaystyle Cov(U, V) &=& E[X^2] - (E[X])^2 - (E[Y^2] - (E[Y])^2 \\ &=& V[X] - V[Y] \\ &=& \sigma^2_1 - \sigma^2_2 \\ \end{eqnarray*}$

となります。

I：◯
$U$ と $V$ の平均の計算結果より、正しいことがわかります。

II：◯
共分散 $Cov(U,V)$ が0の場合、 $U$ と $V$ は互いに独立であるといえます。 $U$ と $V$ の共分散の計算結果より、 $Cov(U, V)=\sigma^2_1 - \sigma^2_2$ となります。この値が0になるのは $\sigma^2_1 = \sigma^2_2$ の場合です。

III：◯
$U$ と $V$ の平均と分散の計算結果より、どちらも平均が0、分散が $\sigma^2_1 = \sigma^2_2$ の正規分布に従います。

問5

母平均を $\mu$ 、標本平均を $\bar{X}$ 、標本から算出した不偏分散を $S^2$ 、サンプルサイズを $n$ とすると、次に示す統計量 $T$ の値は、自由度 $(t-1)$ の t分布に従います。

$\displaystyle T = \frac{\bar{X} - \mu}{\sqrt{\frac{S^2}{n}}}$

したがって、問題文で与えられた $T$ は自由度 $8$ の $t$ 分布に従います。ここで、

$\begin{eqnarray*} \displaystyle P(\bar{X} \geq \mu + 0.62S) &\Leftrightarrow&　P(\bar{X}- \mu \geq 0.62S) \\ &\Leftrightarrow&　P\left(\frac{\bar{X}- \mu}{S} \geq 0.62\right) \\ &\Leftrightarrow&　P\left(\frac{\bar{X}- \mu}{\sqrt{S^2}} \geq 0.62\right) \\ &\Leftrightarrow&　P\left(\frac{\bar{X}- \mu}{\sqrt{S^2}} \times \sqrt{9} \geq 0.62 \times \sqrt{9}\right) \\ &\Leftrightarrow&　P\left(\frac{\bar{X}- \mu}{\sqrt{\frac{S^2}{9}}} \geq 0.62 \times 3\right) \\ &\Leftrightarrow&　P\left(\frac{\bar{X}- \mu}{\sqrt{\frac{S^2}{9}}} \geq 1.86\right) \\ &\Leftrightarrow&　P(T \geq 1.86) \\ \end{eqnarray*}$

と変形できます。t分布表から自由度8の行を見ると、上側確率が $0.05$ となる点が $1.86$ であることがわかります。すなわち、

$\displaystyle P(T \geq 1.86)$

となる確率は0.05となります。

t分布の詳細については「20-1. 標本とt分布」をご覧ください。

問6

問題文より、確率変数 $X_1$ 、 $X_2$ 、 $X_3$ はいずれも標準化されていることから、

$\displaystyle E[X_1] = E[X_2] = E[X_3] = 0$

$\displaystyle V[X_1] = V[X_2] = V[X_3] = 1$

となります。また、確率変数 $X$ と $Y$ の相関係数 $r$ は次の式から算出できます。

$\displaystyle r = \frac{Cov(X,Y)}{\sqrt{V[X]V[Y]}}$

$X_1$ と $X_2$ との相関係数は0.5であることから

$\displaystyle \frac{Cov(X_1,X_2)}{\sqrt{V[X_1]V[X_2]}} = \frac{Cov(X_1,X_2)}{\sqrt{1 \times 1}} = Cov(X_1,X_2) = 0.5$

となります。同様に計算すると、

$\displaystyle Cov(X_1,X_2) = Cov(X_2,X_3) = Cov(X_1,X_3) = 0.5 = \frac{1}{2}$

となります。 $X_1$ と $Y$ との相関係数は

$\begin{eqnarray*} \displaystyle r &=& \frac{Cov(X_1,Y)}{\sqrt{V[X_1]V[Y]}} \\ &=& \frac{Cov \left( X_1,\frac{X_1 + X_2 + X_3}{3} \right) }{\sqrt{1 \times V \left[\frac{X_1 + X_2 + X_3}{3} \right]}} \\ &=& \frac{\frac{Cov(X_1,X_1) + Cov(X_1,X_2) + Cov(X_1,X_3)}{3} }{\sqrt{V \left[ \frac{X_1 + X_2 + X_3}{3} \right]}} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3} Cov(X_1, X_2) + \frac{1}{3} Cov(X_1, X_3) }{A} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3} \times \frac{1}{2} + \frac{1}{3} \times \frac{1}{2} }{\sqrt{\frac{1}{9} \times \left(1 + 1 + 1 + 2 \times \frac{1}{2} + 2 \times \frac{1}{2} + 2 \times \frac{1}{2} \right)}} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{2}{6}}{\sqrt{\frac{6}{9}}} \\ &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3}}{\sqrt{\frac{2}{3}}} \\ \end{eqnarray*}$

ただし、 $A=\sqrt{\frac{1}{9} \times (V[X_1] + V[X_2] + V[X_3] + 2Cov(X_1,X_2) + 2Cov(X_2,X_3) + 2Cov(X_1,X_3))}$ である。ここで $X_1$ と $X_1$ の相関係数が1であることを利用すると、

$\displaystyle \frac{Cov(X_1,X_1)}{\sqrt{V[X_1]V[X_1]}} = \frac{Cov(X_1,X_1)}{\sqrt{1 \times 1}} = Cov(X_1,X_1) = 1$

となることから、上の式に代入すると

$\begin{eqnarray*} \displaystyle r &=& \frac{\frac{1}{3} Cov(X_1, X_1) + \frac{1}{3}}{\sqrt{\frac{2}{3}}} \\ &=& \frac{\frac{1}{3} \times 1 + \frac{1}{3}}{\sqrt{\frac{2}{3}}} \\ &=& \frac{\frac{2}{3}}{\sqrt{\frac{2}{3}}} \\ &=& \sqrt{\frac{2}{3}} \\ &=& \frac{1.41}{1.73} \\ &=& 0.82 \\ \end{eqnarray*}$

となります。

共分散の詳細については「15-6. 2変数の期待値と分散」をご覧ください。

問7

問題文より

$\displaystyle E[X] = \mu$

$\displaystyle V[X] = \sigma^2$

となります。分散は次のように計算することができます。

$\displaystyle V[X] = E[X^2] - (E[X])^2$

この式を利用すると、

$\displaystyle \sigma^2 = E[X^2] - \mu^2$

$\displaystyle E[X^2] = \sigma^2 + \mu^2$

となります。

確率変数の分散の詳細については「12-5. 確率変数の分散」をご覧ください。

問8

さまざまな確率分布の定義をまとめてみます。

カイ二乗分布

$Z_{1}$ , $Z_{2}$ , …, $Z_{k}$ が互いに独立で標準正規分布 $N(0, 1)$ に従う確率変数であるとき、次の式から算出される $\chi^{2}$ は自由度 $k$ のカイ二乗分布に従います。

$\displaystyle \chi^{2}=Z_{1}^{2}+Z_{2}^{2}+\cdots+Z_{k}^{2}$

自由度が1のとき、カイ二乗分布は標準正規分布に従う確率変数を二乗したものに等しくなります。

$\displaystyle \chi^{2}(1)=Z_{1}^{2}$

t分布

標準正規分布 $N(0, 1)$ に従う $Z$ と自由度 $n$ のカイ二乗分布 $W$ があり、これらが互いに独立であるとき、次の式から算出される $t$ は自由度 $n$ のt分布に従います。

$\displaystyle t=\frac{Z}{\sqrt{\frac{W}{n}}}$

F分布

F分布は、自由度が $k_{1}$ 、 $k_{2}$ のカイ二乗分布 $\chi_{1}\sim \chi^{2} (k_{1})$ 、 $\chi_{2} \sim \chi^{2} (k_{2})$ が互いに独立である場合に、次の式から算出されるFが従う確率分布のことです。このときFは自由度 $(k_{1}, k_{2})$ のF分布に従います。

$\displaystyle F=\frac{\chi_{1}^{2} / k_{1}}{\chi_{2}^{2} / k_{2}}$

これらの定義を問題文で与えられた数式に照らし合わせてみます。定義より、 $T$ は自由度5のカイ二乗分布に従います。また、 $V$ は自由度5のt分布に従います。 $W$ は次のように書き換えることができます。

$\displaystyle W = \frac{T/5}{Z_1^2} = \frac{\chi^{2}(5)/5}{\chi^{2}(1)/1}$

この式から、 $W$ は自由度(5, 1)のF分布に従うことが分かります。

次に $\alpha$ を計算します。 $V$ は自由度5のt分布に従うことから、 $P(|V| \geq 1/\sqrt{\alpha})=0.05$ の値を計算するためには、t分布表の自由度5の行から上側2.5％点となる値が必要です（|V|となっているので、上側と下側合わせて0.05 (5%) となる確率を計算します）。t分布表を見ると「2.571」となっているので、

$\displaystyle \frac{1}{\alpha} = 2.571$

となることから、これを解いて $\alpha=0.151$ となります。

カイ二乗分布の詳細については「22-1. カイ二乗分布」を、t分布の詳細については「20-1. 標本とt分布」を、F分布の詳細については「28-1. F分布」をご覧ください。

ブログ