2016年6月統計検定2級の一部問題の解説(詳細版)
2016/06/21
カテゴリ:統計検定
タグ:2016年6月
※統計検定2級 解説記事一覧はこちら※
2016年6月19日に統計検定が実施されました。今回の2級で出題された問題の中で、難しいと思われる問題をいくつかピックアップし、より詳細に解説をします。
この記事では、次の4問の解説をしています。下のリストからクリック、またはタップした問題の解説部分へジャンプします。
問7(回答番号16,17,18)
大学入試の二次試験で出てくるような問題でした。
回答番号18については、一切のヒントがない状態で解く場合にはかなり難易度が高いのですが、ヒントが与えられているので、16・17の誘導に乗れば難しくありません。
■回答番号16
このゲームにおいて、何戦目であっても、一回のゲームでどちらかが勝つ確率は変化しません。 つまり、各ゲームは独立であるので、「AがBに勝ち、Cに負け、その後優勝する」確率はそれぞれの確率の積で表せることが分かります。
勝負の流れを図で表すと、下のようになります。3戦目以降については、「Aが負けて、最終的に優勝する」までの流れは条件付き確率で表せることから、具体的に誰と対戦して勝ったかについては省略できることから、このように表しています。
これより、答えは次のように計算できます。
![Rendered by QuickLaTeX.com \displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2} \times r =\displaystyle \frac{1}{4}r](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-679b074858737500d46db16fa193202e_l3.png)
■回答番号17
問題文から、Aが勝つ確率は、「AがBに勝ち、Cに負け、その後優勝する」または、「Aが2連勝する」または、「Bに負け、その後優勝する」の3パターンがあることが分かります。この3つのパターンでAが優勝する確率をそれぞれ計算してみましょう。
- 「AがBに勝ち、Cに負け、その後優勝する」パターン
- 「Aが2連勝する」パターン
- 「Bに負け、その後優勝する」パターン
これは回答番号16で解いた通り、Aが優勝する確率はです。
このパターンを図で表すと、次のようになります。
このとき、Aが優勝する確率はです。
このパターンを図で表すと、次のようになります。
このとき、Aが優勝する確率はです。
これらの確率は排反であるので、このいずれかのパターンでAが優勝する確率は、この3つの確率の和となります。
つまり、Aが優勝する確率は、以下のように計算できます。
![Rendered by QuickLaTeX.com P_A=\displaystyle \frac{1}{4}r+\displaystyle \frac{1}{4}+\displaystyle \frac{1}{2}r=\displaystyle \frac{1}{4}+\displaystyle \frac{3}{4}r](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-311deeb2c6f8403fa1671584dfdfd141_l3.png)
■回答番号18
回答番号17まで解けていれば、は求められています。
と
も計算してみましょう。
【
について】
Bが優勝するパターンについても、Aと同様に3つのパターンに分けられます。
- 「BがAに勝ち、Cに負け、その後優勝する」パターン
- 「Bが2連勝する」パターン
- 「Aに負け、その後優勝する」パターン
このパターンを図で表すと、次のようになります。
このとき、Bが優勝する確率はです。
このパターンを図で表すと、次のようになります。
このとき、Bが優勝する確率はです。
このパターンを図で表すと、次のようになります。
このとき、Bが優勝する確率はです。
と同様にこれらの確率は排反であるので、このいずれかのパターンでBが優勝する確率は、この3つの確率の和となります。
つまり、Bが優勝する確率は、以下のように計算できます。
![Rendered by QuickLaTeX.com P_B=\displaystyle \frac{1}{4}r+\displaystyle \frac{1}{4}+\displaystyle \frac{1}{2}r=\displaystyle \frac{1}{4}+\displaystyle \frac{3}{4}r](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-35ac2d5abdcd63c4ac3ae29d31ccc4b0_l3.png)
この結果、であることがわかります。
【
について】
についても、
や
と同様に3つのパターンで考えてみましょう。
これまでのパターンを一般化することができ、そうして解くと楽なのですが、今回は全てのパターンを列挙して解きます。
- 「AがBに勝ち、AとCが対戦してCが勝ち、BとCが対戦してCが負けるが、その後優勝する」パターン
- 「BがAに勝ち、BとCが対戦してCが勝ち、AとCが対戦してCが負けるが、その後優勝する」パターン
- 「AがBに勝ち、その後Cが2連勝する」パターン
- 「BがAに勝ち、その後Cが2連勝する」パターン
- 「AがBに勝ち、CがAに負けるがその後優勝する」パターン
- 「BがAに勝ち、CがBに負けるがその後優勝する」パターン
このパターンを図で表すと、次のようになります。
このとき、Cが優勝する確率はです。
このパターンを図で表すと、次のようになります。
![18-5-2](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/06/18-5-2.png)
このとき、Cが優勝する確率はです。
このパターンを図で表すと、次のようになります。
このとき、Cが優勝する確率はです。
このパターンを図で表すと、次のようになります。
このとき、Cが優勝する確率はです。
最初の対戦で負けるパターンです。や
では考えたパターンですが、よく考えるとこれは成り立ちません。図で表してみましょう。
どちらの場合においてもCにとっては最初の対戦ですが、既にAとBが戦っているのでどちらかが1勝しており、Cが負けるとその時点でC以外の優勝が決定してしまいます。
つまり、Cは最初の勝負で負けることはできません。
以上のことから、Cが優勝する確率は、以下のように計算できます。
、
と同様にこれらの確率は排反であるので、それぞれの確率の和を取れば計算できます。
![Rendered by QuickLaTeX.com P_C=\displaystyle \frac{1}{8}r+\displaystyle \frac{1}{8}r+\displaystyle \frac{1}{8}+\displaystyle \frac{1}{8}=\displaystyle \frac{1}{4}+\displaystyle \frac{1}{4}r](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-a768b812ba7299afb9ce361cd3cec0ad_l3.png)
以上より、全ての確率が計算できました。rは0より大きいので、となります。
問8(回答番号19,20)
統計検定2級において、積分を実際に計算する問題は2011年以降出題されていませんでした。
現役の大学生や高校生にとっては恐らく難しくないと思われますが、このタイプの問題は出ないと油断していた社会人の受験者の中には、意表を突かれた方もいらっしゃるのではないでしょうか。
■回答番号19
数理統計学的に厳密な定義ではありませんが、連続型確率変数Xについて、累積分布関数が、確率密度関数が
で表される場合、中央値mは次のようにして定義できます。
![Rendered by QuickLaTeX.com F(m \geqq X) = \displaystyle \int_{-\infty}^{m} f(x) dx=\displaystyle \frac{1}{2}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-3abffb10f5a4ae76c9884fcde70373fa_l3.png)
この問題では累積分布関数が与えられているので、次のように中央値を計算できます。
![Rendered by QuickLaTeX.com F(m)=m^2=\displaystyle \frac{1}{2} \Leftrightarrow m=\displaystyle \frac{1}{ \sqrt{2}} = \displaystyle \frac{ \sqrt{2}}{2} \fallingdotseq \displaystyle \frac{1.414}{2}=0.707](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-d4c64c9c17fe0018e17dd7d809de68f5_l3.png)
■回答番号20
連続型確率分布における分散Vは次の式によって計算できます。
![Rendered by QuickLaTeX.com V=\displaystyle\int_{-\infty}^{\infty} \left( x- \mu \right)^2 f(x) dx](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-d96d5512a419e47341ec9a1d89bb620f_l3.png)
ここで、は分布の平均値です。
は次の式によって計算できます。
![Rendered by QuickLaTeX.com \mu=\displaystyle\int_{-\infty}^{\infty} x f(x) dx](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-408027b2408f6184489c0f69ee49523b_l3.png)
与えられた分布は、以外の範囲では
であるため、積分区間は0から1までを考えればよいことが分かります。
また、確率密度関数は、次の計算により
であることがわかります。
![Rendered by QuickLaTeX.com f(x)=\displaystyle \frac{d}{dx} F(x) =\displaystyle \frac{d}{dx} x^2 =2x](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-452ca289c4b7c02bf00f95658178b654_l3.png)
これを用いて、まずを計算します。
次に、を用いてVを計算します。
よって、求める分散は0.056です。
なお、この問題は分散の別の計算式を用いて計算することもでき、こちらの方が計算が簡単です。
この場合、次のようにVを計算できます。
問9(回答番号21,22)
推定量、という単語に驚くかもしれませんが、標本平均値の従う平均と分散についてと、変動係数について理解していれば解けます。
■回答番号21
母集団の平均が、分散が
であるとき、大きさnの標本の平均値
は次のように計算できます。
![Rendered by QuickLaTeX.com \bar{X}=\displaystyle \frac{1}{n} \sum ^n_{i=1} X_i](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-c93b91bf5fed4120d1ca48da4e1d0b76_l3.png)
このは、母平均
の推定量となっています。
の期待値(平均値)は
で、分散は
です。
変動係数は、で計算することができるので、推定量の変動係数
は次のようになります。
![Rendered by QuickLaTeX.com CV=\displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-2466ef8111c7949793906937b23af60b_l3.png)
■回答番号22
回答番号21で求めた変動係数が0.05以下となればよいことから、次の不等式を考えます。
![Rendered by QuickLaTeX.com \displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu} \leqq 0.05](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-4221f8f8eac77d986126ffb3f2391df8_l3.png)
問題文から、母集団の変動係数が0.8以下であることが分かっているので、母集団における変動係数が出てくるように変形します。
![Rendered by QuickLaTeX.com \displaystyle \frac{\sqrt{\displaystyle \frac{\sigma ^2}{n}}}{\mu}=\displaystyle \frac{1}{\sqrt{n}} \displaystyle \frac{\sigma}{\mu} \leqq 0.05](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-53b0a70da5aa427814865a604bc33bc7_l3.png)
ここで、母集団における変動係数をと置き換えると、次のように変形できます。
![Rendered by QuickLaTeX.com \displaystyle \frac{C}{\sqrt{n}} \leqq 0.05 \\ \Leftrightarrow \displaystyle \frac{1}{\sqrt{n}} \leqq \displaystyle \frac{1}{C} \times 0.05 \\](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-3a75bbd1a769e6be919bbfaafa73227a_l3.png)
今回の場合、Cもnも負の値とはならないので、次のように変形できます
![Rendered by QuickLaTeX.com \displaystyle \frac{1}{\sqrt{n}} \leqq \displaystyle \frac{1}{C} \times 0.05 \\ \Leftrightarrow \sqrt{n} \geqq 20\times C (\geqq0)\\ \Leftrightarrow n \geqq 400 \times C^2](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-3b1d600cb1bd78e115afc6ae9ec91ce7_l3.png)
問題文よりであるので、
のときに、問題の条件を満たす最小の
が計算できます。
![Rendered by QuickLaTeX.com n \geqq 400 \times C^2 \\ \Leftrightarrow n \geqq 400 \times 0.8^2 \geqq 400 \times C^2 \\ \Leftrightarrow n \geqq 256](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-1ef71f7ae8fa666f1390211a0ea4bdc0_l3.png)
問12(回答番号29)
統計検定2級において、検出力を具体的に計算する問題が出題されるのは初めてなので、戸惑った方もいるのではないでしょうか。
この問題は、3つのステップに分けて解くと分かりやすいです。
- 棄却限界における
の値を求める。
- 対立仮説の下で
が従う分布を求める。
- 対立仮説の下で、
が1で求めた棄却限界を上回る確率を計算する。
では、実際に解いていきましょう。
- 棄却限界における
の値を求める。
- 対立仮説の下で
が従う分布を求める。
- 対立仮説の下で、
が1で求めた棄却限界を上回る確率を計算する。
問題文から、棄却域は次のように設定されます。
![Rendered by QuickLaTeX.com \displaystyle \frac{\bar{X}-600}{10} > 2.33](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-ef86a91baa3f6fc1b8ff90af4256f873_l3.png)
この式を変形し、具体的にがどの値なら棄却されるかを計算します。
![Rendered by QuickLaTeX.com \bar{X} > 2.33 \times 10 +600 =623.3](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-011a2340d6cdf967c14b39cc1566195c_l3.png)
これはが623.3を境界として、それより大きければ
が棄却されることを示しています。逆に、623.3以下なら棄却されません。
対立仮説の下でラットの体重Xが従う分布は、平均630、標準偏差50の正規分布です。
正規分布の再生性から、の従う分布は平均630,標準偏差
10の正規分布であることが分かります。
1.で求めた棄却限界と、帰無仮説・対立仮説のもとでが従う分布を図示すると、次のようになります。
青いほうが帰無仮説の下で従う分布で、オレンジ色の方は対立仮説の下で従う分布です。それぞれ、と
です。
の従う分布が分かったので、これが棄却限界623.3を上回る確率を計算します。正規分布の上側累積確率が答えです。
検出力に対応する部分を図示すると、次のようになります。図のオレンジ色の部分の面積が、検出力の値となります。
正規分布の累積分布関数をとすると、この面積は次のように計算できます。
![Rendered by QuickLaTeX.com 1-F\left( \displaystyle \frac{623.3-630}{\sqrt{\frac{50^2}{25}}} \right) =1- F\left( -0.67 \right) =1- 0.2514 =0.7486](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-9020205d8f718be287d3500ab2f138fc_l3.png)