2016年6月統計検定2級の一部問題の解説（詳細版）

2016/06/21

カテゴリ：統計検定

タグ：2016年6月

※統計検定2級解説記事一覧はこちら※

2016年6月19日に統計検定が実施されました。今回の2級で出題された問題の中で、難しいと思われる問題をいくつかピックアップし、より詳細に解説をします。

この記事では、次の4問の解説をしています。下のリストからクリック、またはタップした問題の解説部分へジャンプします。

問7：確率・条件付き確率を求める問題
問8：連続型確率分布の中央値、分散を求める問題
問9：推定量の標準偏差、サンプルサイズを求める問題
問12：検出力を求める問題

問7（回答番号16,17,18）

大学入試の二次試験で出てくるような問題でした。

回答番号18については、一切のヒントがない状態で解く場合にはかなり難易度が高いのですが、ヒントが与えられているので、16・17の誘導に乗れば難しくありません。

■回答番号16

このゲームにおいて、何戦目であっても、一回のゲームでどちらかが勝つ確率は変化しません。つまり、各ゲームは独立であるので、「AがBに勝ち、Cに負け、その後優勝する」確率はそれぞれの確率の積で表せることが分かります。

勝負の流れを図で表すと、下のようになります。3戦目以降については、「Aが負けて、最終的に優勝する」までの流れは条件付き確率 $r$ で表せることから、具体的に誰と対戦して勝ったかについては省略できることから、このように表しています。

16-1-2

これより、答えは次のように計算できます。

$\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}r$

■回答番号17

問題文から、Aが勝つ確率は、「AがBに勝ち、Cに負け、その後優勝する」または、「Aが2連勝する」または、「Bに負け、その後優勝する」の3パターンがあることが分かります。この3つのパターンでAが優勝する確率をそれぞれ計算してみましょう。

「AがBに勝ち、Cに負け、その後優勝する」パターン

これは回答番号16で解いた通り、Aが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}r$ です。

「Aが2連勝する」パターン

このパターンを図で表すと、次のようになります。

16-2-2

このとき、Aが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} =\displaystyle \frac{1}{4}$ です。

「Bに負け、その後優勝する」パターン

このパターンを図で表すと、次のようになります。

16-3-2

このとき、Aが優勝する確率は $\displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{2}r$ です。

これらの確率は排反であるので、このいずれかのパターンでAが優勝する確率は、この3つの確率の和となります。

つまり、Aが優勝する確率 $P_A$ は、以下のように計算できます。

$P_A=\displaystyle \frac{1}{4}r+\displaystyle \frac{1}{4}+\displaystyle \frac{1}{2}r=\displaystyle \frac{1}{4}+\displaystyle \frac{3}{4}r$

■回答番号18

回答番号17まで解けていれば、 $P_A$ は求められています。 $P_B$ と $P_C$ も計算してみましょう。

【 $P_B$ について】

Bが優勝するパターンについても、Aと同様に3つのパターンに分けられます。

「BがAに勝ち、Cに負け、その後優勝する」パターン

このパターンを図で表すと、次のようになります。

18-1-2

このとき、Bが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}r$ です。

「Bが2連勝する」パターン

このパターンを図で表すと、次のようになります。

18-2-2

このとき、Bが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} =\displaystyle \frac{1}{4}$ です。

「Aに負け、その後優勝する」パターン

このパターンを図で表すと、次のようになります。

18-3-2

このとき、Bが優勝する確率は $\displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{2}r$ です。

$P_A$ と同様にこれらの確率は排反であるので、このいずれかのパターンでBが優勝する確率は、この3つの確率の和となります。

つまり、Bが優勝する確率 $P_B$ は、以下のように計算できます。

$P_B=\displaystyle \frac{1}{4}r+\displaystyle \frac{1}{4}+\displaystyle \frac{1}{2}r=\displaystyle \frac{1}{4}+\displaystyle \frac{3}{4}r$

この結果、 $P_A=P_B$ であることがわかります。

【 $P_C$ について】

$P_C$ についても、 $P_A$ や $P_B$ と同様に3つのパターンで考えてみましょう。

これまでのパターンを一般化することができ、そうして解くと楽なのですが、今回は全てのパターンを列挙して解きます。

「AがBに勝ち、AとCが対戦してCが勝ち、BとCが対戦してCが負けるが、その後優勝する」パターン

このパターンを図で表すと、次のようになります。

18-4-2

このとき、Cが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}\times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{8}r$ です。

「BがAに勝ち、BとCが対戦してCが勝ち、AとCが対戦してCが負けるが、その後優勝する」パターン

このパターンを図で表すと、次のようになります。

このとき、Cが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}\times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{8}r$ です。

「AがBに勝ち、その後Cが2連勝する」パターン

このパターンを図で表すと、次のようになります。

18-6-2

このとき、Cが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{8}$ です。

「BがAに勝ち、その後Cが2連勝する」パターン

このパターンを図で表すと、次のようになります。

18-7-2

このとき、Cが優勝する確率は $\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{8}$ です。

「AがBに勝ち、CがAに負けるがその後優勝する」パターン
「BがAに勝ち、CがBに負けるがその後優勝する」パターン

最初の対戦で負けるパターンです。 $P_A$ や $P_B$ では考えたパターンですが、よく考えるとこれは成り立ちません。図で表してみましょう。

18-8-2

18-9-2

どちらの場合においてもCにとっては最初の対戦ですが、既にAとBが戦っているのでどちらかが1勝しており、Cが負けるとその時点でC以外の優勝が決定してしまいます。

つまり、Cは最初の勝負で負けることはできません。

以上のことから、Cが優勝する確率 $P_C$ は、以下のように計算できます。 $P_A$ 、 $P_B$ と同様にこれらの確率は排反であるので、それぞれの確率の和を取れば計算できます。

$P_C=\displaystyle \frac{1}{8}r+\displaystyle \frac{1}{8}r+\displaystyle \frac{1}{8}+\displaystyle \frac{1}{8}=\displaystyle \frac{1}{4}+\displaystyle \frac{1}{4}r$

以上より、全ての確率が計算できました。rは0より大きいので、 $P_A=P_B > P_C$ となります。

問8（回答番号19,20）

統計検定2級において、積分を実際に計算する問題は2011年以降出題されていませんでした。

現役の大学生や高校生にとっては恐らく難しくないと思われますが、このタイプの問題は出ないと油断していた社会人の受験者の中には、意表を突かれた方もいらっしゃるのではないでしょうか。

■回答番号19

数理統計学的に厳密な定義ではありませんが、連続型確率変数Xについて、累積分布関数が $F(X)$ 、確率密度関数が $f(x)$ で表される場合、中央値mは次のようにして定義できます。

$F(m \geqq X) = \displaystyle \int_{-\infty}^{m} f(x) dx=\displaystyle \frac{1}{2}$

この問題では累積分布関数が与えられているので、次のように中央値を計算できます。

$F(m)=m^2=\displaystyle \frac{1}{2} \Leftrightarrow m=\displaystyle \frac{1}{ \sqrt{2}} = \displaystyle \frac{ \sqrt{2}}{2} \fallingdotseq \displaystyle \frac{1.414}{2}=0.707$

■回答番号20

連続型確率分布における分散Vは次の式によって計算できます。

$V=\displaystyle\int_{-\infty}^{\infty} \left( x- \mu \right)^2 f(x) dx$

ここで、 $\mu$ は分布の平均値です。 $\mu$ は次の式によって計算できます。

$\mu=\displaystyle\int_{-\infty}^{\infty} x f(x) dx$

与えられた分布は、 $[0,1]$ 以外の範囲では $f(x)=0$ であるため、積分区間は0から1までを考えればよいことが分かります。

また、確率密度関数 $f(x)$ は、次の計算により $f(x)=2x$ であることがわかります。

$f(x)=\displaystyle \frac{d}{dx} F(x) =\displaystyle \frac{d}{dx} x^2 =2x$

これを用いて、まず $\mu$ を計算します。

$\begin{equation*} \begin{split} \mu&=\displaystyle\int_{-\infty}^{\infty} x f(x) dx \\ &=\displaystyle\int_{-\infty}^{0} x \cdot 0 dx + \displaystyle\int_{0}^{1} x f(x) dx \\ &\quad + \displaystyle\int_{1}^{\infty} x \cdot 0 dx \\ &=\displaystyle\int_{0}^{1} x \cdot 2x dx \\ &= \left[ \displaystyle \frac{2x^3}{3} \right]^1_0=\displaystyle \frac{2}{3} \end{split} \end{equation*}$

次に、 $\mu$ を用いてVを計算します。

$\begin{equation*} \begin{split} V&=\displaystyle\int_{-\infty}^{\infty} \left( x- \displaystyle \frac{2}{3} \right)^2 f(x) dx \\ &=\displaystyle\int_{-\infty}^{0} \left( x- \displaystyle \frac{2}{3} \right)^2 \cdot 0 dx + \displaystyle\int_{0}^{1} \left( x- \displaystyle \frac{2}{3} \right)^2 f(x) dx \\ &\quad + \displaystyle\int_{1}^{\infty} \left( x- \displaystyle \frac{2}{3} \right)^2 \cdot 0 dx \\ &=\displaystyle\int_{0}^{1} \left( x- \displaystyle \frac{2}{3} \right)^2 \cdot 2x dx \\ &=\displaystyle\int_{0}^{1} \left( 2x^3 - \displaystyle \frac{8}{3}x^2+ \displaystyle \frac{8}{9}x \right) dx \\ &= \left[ \displaystyle \frac{x^4}{2} - \displaystyle \frac{8x^3}{9} +\displaystyle \frac{4x^2}{9} \right]^1_0 \\ &=\displaystyle \frac{1}{2} - \displaystyle \frac{8}{9} + \displaystyle \frac{4}{9} \\ &=\displaystyle \frac{1}{18}=0.0555\cdots =0.056 \end{split} \end{equation*}$

よって、求める分散は0.056です。

なお、この問題は分散の別の計算式 $V(X)=E(X^2) - \left{E(X) \right}^2$ を用いて計算することもでき、こちらの方が計算が簡単です。

この場合、次のようにVを計算できます。

$\begin{equation*} \begin{split} V&=\displaystyle\int_{0}^{1} x^2 f(x) dx - \displaystyle\int_{0}^{1} x f(x) dx \\ &=\displaystyle\int_{0}^{1} 2x^3 dx - \mu^2 \\ &=\left[ \displaystyle \frac{x^4}{2} \right]^1_0 - \left( \displaystyle \frac{2}{3} \right)^2 \\ &=\displaystyle \frac{1}{2} - \displaystyle \frac{4}{9}=\displaystyle \frac{1}{18} \end{split} \end{equation*}$

問9（回答番号21,22）

推定量、という単語に驚くかもしれませんが、標本平均値の従う平均と分散についてと、変動係数について理解していれば解けます。

■回答番号21

母集団の平均が $\mu$ 、分散が $\sigma^2$ であるとき、大きさnの標本の平均値 $\bar{X}$ は次のように計算できます。

$\bar{X}=\displaystyle \frac{1}{n} \sum ^n_{i=1} X_i$

この $\bar{X}$ は、母平均 $\mu$ の推定量となっています。

$\bar{X}$ の期待値（平均値）は $\mu$ で、分散は $\displaystyle \frac{\sigma ^2}{n}$ です。

変動係数は、 $\displaystyle \frac{\sigma}{\mu}$ で計算することができるので、推定量の変動係数 $CV$ は次のようになります。

$CV=\displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu}$

■回答番号22

回答番号21で求めた変動係数が0.05以下となればよいことから、次の不等式を考えます。

$\displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu} \leqq 0.05$

問題文から、母集団の変動係数が0.8以下であることが分かっているので、母集団における変動係数 $\displaystyle \frac{\sigma}{\mu}$ が出てくるように変形します。

$\displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu}=\displaystyle \frac{1}{\sqrt{n}} \displaystyle \frac{\sigma}{\mu} \leqq 0.05$

ここで、母集団における変動係数を $C$ と置き換えると、次のように変形できます。

$\displaystyle \frac{C}{\sqrt{n}} \leqq 0.05 \\ \Leftrightarrow \displaystyle \frac{1}{\sqrt{n}} \leqq \displaystyle \frac{1}{C} \times 0.05 \\$

今回の場合、Cもnも負の値とはならないので、次のように変形できます

$\displaystyle \frac{1}{\sqrt{n}} \leqq \displaystyle \frac{1}{C} \times 0.05 \\ \Leftrightarrow \sqrt{n} \geqq 20\times C (\geqq0)\\ \Leftrightarrow n \geqq 400 \times C^2$