BellCurve 統計WEB

未経験からデータ分析が学べる
最大55万円の給付金還付

ブログ


2016年11月統計検定2級の問題の解説(その2)

2017/06/16

カテゴリ:

※統計検定2級 解説記事一覧はこちら


2016年11月に実施された統計検定2級の問題の解説をしています。

 

この記事では、次の6問の解説をしています。下のリストからクリック、またはタップした問題の解説部分へジャンプします。

 

 

問7(回答番号12,13)

■回答番号12

「●型の人を正しく●型と言い当てる確率」をそれぞれ4つの血液型に対して計算し、和を取ったものが答えです。

 \displaystyle \frac{4}{10} \times \frac{4}{10} + \frac{3}{10} \times \frac{3}{10} + \frac{2}{10} \times \frac{2}{10} + \frac{1}{10} \times \frac{1}{10} = \frac{16+9+4+1}{100}= \frac{3}{10}

 

■回答番号13

求める確率は、次のような条件付き確率です。

分子は、「A型の人がA型であると予測される確率」です。この確率は次のように求められます。

分母は、「A/B/O/AB型の人がA型であると予測される確率」です。問題文より、A型でない人がA型と予測される確率は\frac{1}{3}であることから、この確率は次のように求められます。

以上の事から、次のように求めることができます。

 

 

問8(回答番号14,15)

■回答番号14

問題から、X_1,X_2,X_3は全て標準化されているということから、

 E(X_i)=0 , V(X_i)=1

であることが分かります。また、X_1Yの相関係数r_{X_1Y}は、相関係数の定義より

 r_{X_1Y}= \displaystyle \frac{Cov(X_1,Y)}{\sqrt{V(X_1)V(Y)}}

となるので、V(Y)Cov(X_1,Y)が分かれば求めることができます。

まず、V(Y)を求めます。Y=\frac{X_1+X_2+X_3}{3}であるので、V(Y)

 V(Y)= \displaystyle \frac{1}{9} V(X_1+X_2+X_3) \\ = \frac{1}{9} \left( V(X_1)+V(X_2)+V(X_3)+2Cov(X_1,X_2)+2Cov(X_2,X_3)+2Cov(X_1,X_3) \right)

と変形できます。ここで、X_1,X_2,X_3が互いに無相関であることから、Cov(X_i,X_j)=0 (i \neq j)となります。これを代入すると、

 V(Y)= \frac{3}{9}= \frac{1}{3}

となります。次にCov(X_1,Y)を求めます。

 \displaystyle  Cov(X_1,Y)=Cov \left(X_1, \frac{X_1+X_2+X_3}{3} \right) \\ = \frac{1}{3} \left( V(X_1)+Cov(X_1,X_2)+ Cov(X_1,X_3) \right) = \frac{1}{3}

以上の事から、r_{X_1Y}は次のようになります。

 r_{X_1Y}= \displaystyle \frac{\frac{1}{3}}{\sqrt{\frac{1}{3}}} = \frac{1}{\sqrt{3}}=0.577..

 

■回答番号15

前問と同様に、V(Y),Cov(X_1,Y)を求めれば解けます。最初に、V(Y)は前問の通り

 V(Y)= \displaystyle \frac{1}{9} V(X_1+X_2+X_3) \\ = \frac{1}{9} \left( V(X_1)+V(X_2)+V(X_3)+2Cov(X_1,X_2)+2Cov(X_2,X_3)+2Cov(X_1,X_3) \right)

と変形できますが、それぞれのX_i同士の相関係数が0.5であることから、Cov(X_i,X_j)=0.5 (i \neq j)となることが違います。これを代入すると次のようになります。

 \displaystyle V(Y)= \frac{1}{9} \left( 1+1+1+2 \times 0.5 +2 \times 0.5 +2 \times 0.5 \right) = \frac{2}{3}

Cov(X_1,Y)についても同様に

 \displaystyle  Cov(X_1,Y)=Cov \left(X_1, \frac{X_1+X_2+X_3}{3} \right) \\ = \frac{1}{3} \left( V(X_1)+Cov(X_1,X_2)+ Cov(X_1,X_3) \right) = \frac{2}{3}

となります。以上の事から、求める相関係数は

 r_{X_1Y}= \displaystyle \frac{\frac{2}{3}}{\sqrt{\frac{2}{3}}} = \frac{\sqrt{2}}{\sqrt{3}}=0.82..

 

 

問9(回答番号16,17,18)

■回答番号16

パラメータ\lambdaのポアソン分布の平均と分散は\lambdaとなります。

 

■回答番号17

イベント参加人数を確率変数Xとおくと、求める確率はP(X  \geq 60)です。問題文から、Xは正規分布に従うと見なせることから

 X \sim N \left( \lambda, \lambda \right) = N(50,50)

と考えられます。よって、求める確率は

 P(X \geq 60) = P \left( \frac{X-50}{\sqrt{50}} \geq \frac{60-50}{\sqrt{50}} =1.41... \right)

となり、標準正規分布表からZ=1.41の上側確率を参照すると、0.079であることが分かります。

 

■回答番号18

問題文より、景品を用意する個数Xについて、P(X+30 \geq m) = 0.05 となるようなmを求めればよいことが分かります。問題文より、Xは正規分布に従うことから、

 X \sim N \left( \lambda, \lambda \right) = N(20,20)

と考えられます。

 P(X+30 \geq m) = P \left( \frac{X-20}{\sqrt{20}} \geq \frac{m-50}{\sqrt{20}} \right)

となりますが、この確率が0.05になるようなZを標準正規分布表から探してくると、Z=1.64となります。よって、

  \frac{m-50}{\sqrt{20}}=1.64 \Leftrightarrow m= 50+ 1.64 \times \sqrt{20} \simeq 57

となります。

 

 

問10(回答番号19,20)

■回答番号19

f(x)は次のような形の関数です。x=0を中心にした左右対称な三角形の形状をしていることが分かります。

まず、期待値E(X)を計算します。

 \displaytyle \int_{-1}^{0} x(x+1)dx + \int_{0}^{1} x(-x+1)dx = \left[ \frac{x^3}{3}+ \frac{x^2}{2} \right]_{-1}^{0} + \left[ - \frac{x^3}{3} + \frac{x^2}{2} \right]_{0}^{1} \\ = \left( 0+0 \right) - \left( - \frac{1}{3} +\frac{1}{2} \right) + \left( - \frac{1}{3}+ \frac{1}{2} \right) - \left( 0+0 \right) =0

x=0で左右対称であるため、直観的にE(X)=0と求めても大丈夫です。ただし、コーシー分布などの場合はこの方法が使えないことに注意しましょう。

次に、分散を計算します。E(X)=0であることから、\left( x-E(X) \right)^2 = x^2となる事を用います。

 \displaytyle \int_{-1}^{0} x^2(x+1)dx + \int_{0}^{1} x^2(-x+1)dx = \left[ \frac{x^4}{4}+ \frac{x^3}{3} \right]_{-1}^{0} + \left[ - \frac{x^4}{4} + \frac{x^3}{3} \right]_{0}^{1} \\ = \left( 0+0 \right) - \left( \frac{1}{4} - \frac{1}{3} \right) + \left( - \frac{1}{4}+ \frac{1}{3} \right) - \left( 0+0 \right) = \frac{1}{12}+ \frac{1}{12} =\frac{1}{6}

 

■回答番号20

第一四分位数は、累積分布関数をF(x)とするとF(x)=0.25となるxです。今回の分布では、X=0に対して左右対称であることから、X \leq 0の範囲のみで考えてよいことが分かります。

f(x)x \leq 0での累積分布関数は次の通りです。

 \displaystyle  \int_{-1}^{x} (y+1)dy = \frac{x^2}{2}+ x + \frac{1}{2}

これが0.25となればよいので、次の方程式を解けばよいことが分かります

 \frac{x^2}{2}+ x + \frac{1}{2} = \frac{1}{4}

これは二次方程式であるため解は二つあり、次のようになります。

 \displaystyle x=-1 \pm \frac{\sqrt{2}}{2}

しかし、x=-1-\frac{\sqrt{2}}{2}は-1よりも小さいため、不適であることが分かります。以上の事から、x=-1 + \frac{\sqrt{2}}{2}が求める第一四分位数となります。

 

 

問11(回答番号21,22)

■回答番号21

この問題は、期待値と分散の関係式を使うと簡単に解けます。

 V(X)= E(X^2) - \left\{ E(X) \right\} ^2 \Leftrightarrow E(X^2) = \left\{ E(X) \right\}^2 +V(X)

よって、E(X_1^2)は次のようになります。

 E(X_1^2)= \left\{ E(X_1) \right\}^2 +V(X_1) = \mu^2 + \sigma^2

 

■回答番号22

まず(ア)について、\sigma^2の不偏推定量のひとつは不偏分散が考えられます。この時点で、選択肢は2つに絞られることが分かります。次に\mu^2についてですが、標本平均の二乗\bar{X}^2の期待値E \left( \bar{X}^2 \right)を考えてみます。

前問と同様に、期待値と分散の関係式を使います。

 E( \bar{X}^2) = \left\{ E(\bar{X}) \right\}^2 +V(\bar{X})

V( \bar{X})については、次の関係を用います。

独立な確率変数X_iがあり、期待値は\muで分散は\sigma^2であるとき、その標本平均

 \displaystyle \bar{X} = \frac{1}{n} \sum_{i} X_i

の期待値と分散はそれぞれ次のようになる。

 \displaystyle E \left( \bar{X} \right) = \mu \\ V( \bar{X} ) = \frac{\sigma^2}{n}

これを用いると、E( \bar{X}^2)

 \displaystyle  E( \bar{X}^2) = \mu^2 + \frac{\sigma^2}{n}

となることが分かります。E( \bar{X}^2)そのままでは、\mu^2の不偏推定量にはなりません。ここで、\sigma^2の不偏推定量である\hat{\sigma}^2を用いて\mu^2の不偏推定量を構成することを考えます。

ある定数kを用いて、\bar{X}^2\hat{\sigma}^2の和を作ると、次のようになります。

 \displaystyle E( \bar{X}^2 + k \hat{\sigma}^2) = \mu^2 + \frac{\sigma^2}{n} + k \sigma^2

これが\mu^2となるようなkの値を求めると、k=- \frac{1}{n}となります。以上の事から、

 \displaystyle \bar{X}^2 - \frac{ \hat{\sigma}^2}{n}

という推定量が、\mu^2の不偏推定量となります。

 

 

2016年11月問題の解説

  1. その1:問1~問6

  2. その2:問7~問11(本記事)
  3. その3:問12~問16



統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)