BellCurve 統計WEB

データサイエンスアカデミー

ブログ

2016年6月統計検定2級の一部問題の解説(詳細版)

2016/06/21

カテゴリ:

※統計検定2級 解説記事一覧はこちら


2016年6月19日に統計検定が実施されました。今回の2級で出題された問題の中で、難しいと思われる問題をいくつかピックアップし、より詳細に解説をします。

 

この記事では、次の4問の解説をしています。下のリストからクリック、またはタップした問題の解説部分へジャンプします。

 

 

問7(回答番号16,17,18)

大学入試の二次試験で出てくるような問題でした。

回答番号18については、一切のヒントがない状態で解く場合にはかなり難易度が高いのですが、ヒントが与えられているので、16・17の誘導に乗れば難しくありません。

 

■回答番号16

このゲームにおいて、何戦目であっても、一回のゲームでどちらかが勝つ確率は変化しません。 つまり、各ゲームは独立であるので、「AがBに勝ち、Cに負け、その後優勝する」確率はそれぞれの確率の積で表せることが分かります。

勝負の流れを図で表すと、下のようになります。3戦目以降については、「Aが負けて、最終的に優勝する」までの流れは条件付き確率rで表せることから、具体的に誰と対戦して勝ったかについては省略できることから、このように表しています。

16-1-2

これより、答えは次のように計算できます。

 \displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}r

 

 

■回答番号17

問題文から、Aが勝つ確率は、「AがBに勝ち、Cに負け、その後優勝する」または、「Aが2連勝する」または、「Bに負け、その後優勝する」の3パターンがあることが分かります。この3つのパターンでAが優勝する確率をそれぞれ計算してみましょう。

 

  • 「AがBに勝ち、Cに負け、その後優勝する」パターン
  • これは回答番号16で解いた通り、Aが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}rです。

     

  • 「Aが2連勝する」パターン
  • このパターンを図で表すと、次のようになります。

    16-2-2

    このとき、Aが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} =\displaystyle \frac{1}{4}です。

     

  • 「Bに負け、その後優勝する」パターン
  • このパターンを図で表すと、次のようになります。

    16-3-2

    このとき、Aが優勝する確率は\displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{2}rです。

     

これらの確率は排反であるので、このいずれかのパターンでAが優勝する確率は、この3つの確率の和となります。

つまり、Aが優勝する確率P_Aは、以下のように計算できます。

 P_A=\displaystyle \frac{1}{4}r+\displaystyle \frac{1}{4}+\displaystyle \frac{1}{2}r=\displaystyle \frac{1}{4}+\displaystyle \frac{3}{4}r

 

■回答番号18

回答番号17まで解けていれば、P_Aは求められています。P_BP_Cも計算してみましょう。

 

P_Bについて】

Bが優勝するパターンについても、Aと同様に3つのパターンに分けられます。

 

  • 「BがAに勝ち、Cに負け、その後優勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-1-2

    このとき、Bが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}rです。

     

  • 「Bが2連勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-2-2

    このとき、Bが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} =\displaystyle \frac{1}{4}です。

     

  • 「Aに負け、その後優勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-3-2

    このとき、Bが優勝する確率は\displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{2}rです。

     

P_Aと同様にこれらの確率は排反であるので、このいずれかのパターンでBが優勝する確率は、この3つの確率の和となります。

つまり、Bが優勝する確率P_Bは、以下のように計算できます。

 P_B=\displaystyle \frac{1}{4}r+\displaystyle \frac{1}{4}+\displaystyle \frac{1}{2}r=\displaystyle \frac{1}{4}+\displaystyle \frac{3}{4}r

 

この結果、P_A=P_Bであることがわかります。

 

 

P_Cについて】

P_Cについても、P_AP_Bと同様に3つのパターンで考えてみましょう。

これまでのパターンを一般化することができ、そうして解くと楽なのですが、今回は全てのパターンを列挙して解きます。

 

  • 「AがBに勝ち、AとCが対戦してCが勝ち、BとCが対戦してCが負けるが、その後優勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-4-2

    このとき、Cが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}\times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{8}rです。

     

  • 「BがAに勝ち、BとCが対戦してCが勝ち、AとCが対戦してCが負けるが、その後優勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-5-2

    このとき、Cが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}\times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{8}rです。

     

  • 「AがBに勝ち、その後Cが2連勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-6-2

    このとき、Cが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}  \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{8}です。

     

  • 「BがAに勝ち、その後Cが2連勝する」パターン
  • このパターンを図で表すと、次のようになります。

    18-7-2

    このとき、Cが優勝する確率は\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}  \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{8}です。

     

  • 「AがBに勝ち、CがAに負けるがその後優勝する」パターン
  • 「BがAに勝ち、CがBに負けるがその後優勝する」パターン
  • 最初の対戦で負けるパターンです。P_AP_Bでは考えたパターンですが、よく考えるとこれは成り立ちません。図で表してみましょう。

    18-8-2

    18-9-2

    どちらの場合においてもCにとっては最初の対戦ですが、既にAとBが戦っているのでどちらかが1勝しており、Cが負けるとその時点でC以外の優勝が決定してしまいます。

    つまり、Cは最初の勝負で負けることはできません。

     

以上のことから、Cが優勝する確率P_Cは、以下のように計算できます。P_AP_Bと同様にこれらの確率は排反であるので、それぞれの確率の和を取れば計算できます。

 P_C=\displaystyle \frac{1}{8}r+\displaystyle \frac{1}{8}r+\displaystyle \frac{1}{8}+\displaystyle \frac{1}{8}=\displaystyle \frac{1}{4}+\displaystyle \frac{1}{4}r

 

以上より、全ての確率が計算できました。rは0より大きいので、P_A=P_B > P_Cとなります。

 

 

問8(回答番号19,20)

統計検定2級において、積分を実際に計算する問題は2011年以降出題されていませんでした。

現役の大学生や高校生にとっては恐らく難しくないと思われますが、このタイプの問題は出ないと油断していた社会人の受験者の中には、意表を突かれた方もいらっしゃるのではないでしょうか。

 

■回答番号19

数理統計学的に厳密な定義ではありませんが、連続型確率変数Xについて、累積分布関数がF(X)、確率密度関数がf(x)で表される場合、中央値mは次のようにして定義できます。

 F(m \geqq X) = \displaystyle \int_{-\infty}^{m} f(x) dx=\displaystyle \frac{1}{2}

 

この問題では累積分布関数が与えられているので、次のように中央値を計算できます。

 F(m)=m^2=\displaystyle \frac{1}{2} \Leftrightarrow m=\displaystyle \frac{1}{ \sqrt{2}} = \displaystyle \frac{ \sqrt{2}}{2} \fallingdotseq \displaystyle \frac{1.414}{2}=0.707

 

 

■回答番号20

連続型確率分布における分散Vは次の式によって計算できます。

 V=\displaystyle\int_{-\infty}^{\infty} \left( x- \mu \right)^2 f(x) dx

 

ここで、\muは分布の平均値です。\muは次の式によって計算できます。

 \mu=\displaystyle\int_{-\infty}^{\infty} x f(x) dx

 

与えられた分布は、[0,1]以外の範囲ではf(x)=0であるため、積分区間は0から1までを考えればよいことが分かります。

また、確率密度関数f(x)は、次の計算によりf(x)=2xであることがわかります。

 f(x)=\displaystyle \frac{d}{dx} F(x) =\displaystyle \frac{d}{dx} x^2 =2x

 

これを用いて、まず\muを計算します。

     \begin{equation*} \begin{split} \mu&=\displaystyle\int_{-\infty}^{\infty} x f(x) dx \\ &=\displaystyle\int_{-\infty}^{0} x \cdot 0 dx + \displaystyle\int_{0}^{1} x f(x) dx \\ &\quad + \displaystyle\int_{1}^{\infty} x \cdot 0 dx \\ &=\displaystyle\int_{0}^{1} x \cdot 2x dx \\ &= \left[ \displaystyle \frac{2x^3}{3} \right]^1_0=\displaystyle \frac{2}{3} \end{split} \end{equation*}

 

次に、\muを用いてVを計算します。

     \begin{equation*} \begin{split} V&=\displaystyle\int_{-\infty}^{\infty} \left( x- \displaystyle \frac{2}{3} \right)^2 f(x) dx \\  &=\displaystyle\int_{-\infty}^{0} \left( x- \displaystyle \frac{2}{3} \right)^2 \cdot 0 dx + \displaystyle\int_{0}^{1} \left( x- \displaystyle \frac{2}{3} \right)^2 f(x) dx \\ &\quad + \displaystyle\int_{1}^{\infty} \left( x- \displaystyle \frac{2}{3} \right)^2 \cdot 0 dx \\  &=\displaystyle\int_{0}^{1} \left( x- \displaystyle \frac{2}{3} \right)^2 \cdot 2x dx \\ &=\displaystyle\int_{0}^{1} \left( 2x^3 - \displaystyle \frac{8}{3}x^2+ \displaystyle \frac{8}{9}x \right)  dx \\  &= \left[ \displaystyle \frac{x^4}{2} - \displaystyle \frac{8x^3}{9} +\displaystyle \frac{4x^2}{9}  \right]^1_0 \\ &=\displaystyle \frac{1}{2} - \displaystyle \frac{8}{9} + \displaystyle \frac{4}{9} \\ &=\displaystyle \frac{1}{18}=0.0555\cdots =0.056 \end{split} \end{equation*}

 

よって、求める分散は0.056です。

なお、この問題は分散の別の計算式V(X)=E(X^2) - \left{E(X) \right}^2を用いて計算することもでき、こちらの方が計算が簡単です。

この場合、次のようにVを計算できます。

     \begin{equation*} \begin{split} V&=\displaystyle\int_{0}^{1}  x^2 f(x) dx - \displaystyle\int_{0}^{1}  x f(x) dx \\ &=\displaystyle\int_{0}^{1}  2x^3 dx - \mu^2  \\ &=\left[ \displaystyle \frac{x^4}{2} \right]^1_0 -  \left( \displaystyle \frac{2}{3} \right)^2 \\ &=\displaystyle \frac{1}{2} - \displaystyle \frac{4}{9}=\displaystyle \frac{1}{18} \end{split} \end{equation*}

 

 

問9(回答番号21,22)

推定量、という単語に驚くかもしれませんが、標本平均値の従う平均と分散についてと、変動係数について理解していれば解けます。

 

■回答番号21

母集団の平均が\mu、分散が\sigma^2であるとき、大きさnの標本の平均値\bar{X}は次のように計算できます。

 \bar{X}=\displaystyle \frac{1}{n} \sum ^n_{i=1} X_i

 

この\bar{X}は、母平均\muの推定量となっています。

\bar{X}の期待値(平均値)は\muで、分散は\displaystyle \frac{\sigma ^2}{n}です。

変動係数は、\displaystyle \frac{\sigma}{\mu}で計算することができるので、推定量の変動係数CVは次のようになります。

 CV=\displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu}

 

 

■回答番号22

回答番号21で求めた変動係数が0.05以下となればよいことから、次の不等式を考えます。

 \displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu} \leqq 0.05

 

問題文から、母集団の変動係数が0.8以下であることが分かっているので、母集団における変動係数\displaystyle \frac{\sigma}{\mu}が出てくるように変形します。

 \displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu}=\displaystyle \frac{1}{\sqrt{n}} \displaystyle \frac{\sigma}{\mu} \leqq 0.05

 

ここで、母集団における変動係数をCと置き換えると、次のように変形できます。

 \displaystyle \frac{C}{\sqrt{n}} \leqq 0.05 \\ \Leftrightarrow   \displaystyle \frac{1}{\sqrt{n}} \leqq \displaystyle \frac{1}{C} \times 0.05 \\

 

今回の場合、Cもnも負の値とはならないので、次のように変形できます

 \displaystyle \frac{1}{\sqrt{n}} \leqq \displaystyle \frac{1}{C} \times 0.05 \\ \Leftrightarrow   \sqrt{n} \geqq 20\times C (\geqq0)\\ \Leftrightarrow n \geqq 400 \times C^2

 

問題文よりC\leqq 0.8であるので、C=0.8のときに、問題の条件を満たす最小のnが計算できます。

 n \geqq 400 \times C^2 \\ \Leftrightarrow n \geqq 400 \times 0.8^2 \geqq 400 \times C^2 \\ \Leftrightarrow n \geqq 256

 

 

問12(回答番号29)

統計検定2級において、検出力を具体的に計算する問題が出題されるのは初めてなので、戸惑った方もいるのではないでしょうか。

この問題は、3つのステップに分けて解くと分かりやすいです。

  1. 棄却限界における\bar{X}の値を求める。
  2. 対立仮説の下で\bar{X}が従う分布を求める。
  3. 対立仮説の下で、\bar{X}が1で求めた棄却限界を上回る確率を計算する。

では、実際に解いていきましょう。

 

  1. 棄却限界における\bar{X}の値を求める。
  2. 問題文から、棄却域は次のように設定されます。

     \displaystyle \frac{\bar{X}-600}{10} > 2.33

     

    この式を変形し、具体的に\bar{X}がどの値なら棄却されるかを計算します。

     \bar{X} > 2.33 \times 10 +600 =623.3

     

    これは\bar{X}623.3を境界として、それより大きければH_0が棄却されることを示しています。逆に、623.3以下なら棄却されません。

     

     

  3. 対立仮説の下で\bar{X}が従う分布を求める。
  4. 対立仮説の下でラットの体重Xが従う分布は、平均630、標準偏差50の正規分布です。

    正規分布の再生性から、\bar{X}の従う分布は平均630,標準偏差\sqrt{\frac{50^2}{25}}=10の正規分布であることが分かります。

    1.で求めた棄却限界と、帰無仮説・対立仮説のもとで\bar{X}が従う分布を図示すると、次のようになります。

    青いほうが帰無仮説の下で従う分布で、オレンジ色の方は対立仮説の下で従う分布です。それぞれ、N(600,10)N(630,10)です。

    29-1

     

     

  5. 対立仮説の下で、\bar{X}が1で求めた棄却限界を上回る確率を計算する。
  6. \bar{X}の従う分布が分かったので、これが棄却限界623.3を上回る確率を計算します。正規分布の上側累積確率が答えです。

    検出力に対応する部分を図示すると、次のようになります。図のオレンジ色の部分の面積が、検出力の値となります。

    29-2

     

    正規分布の累積分布関数をF(x)とすると、この面積は次のように計算できます。

     1-F\left( \displaystyle \frac{623.3-630}{\sqrt{\frac{50^2}{25}}} \right) =1- F\left(  -0.67  \right) =1- 0.2514 =0.7486


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)