BellCurve 統計WEB

ブログ

2016年11月統計検定2級の問題の解説(その3)

2017/06/20

カテゴリ:

※統計検定2級 解説記事一覧はこちら


2級の範囲を超えていますが、この問題は多変量正規分布の問題として解くこともできます。そのために必要な多変量正規分布の性質を紹介します。ある確率変数ベクトル\mbox{\boldmath{x}}が平均\mbox{\boldmath{\mu}}、共分散行列\mbox{\boldmath{\Sigma}}の多変量正規分布に従うとき、線型変換y= Ax+bを行った場合yは次のような多変量正規分布に従います。

 y \sim N \left( \boldmath{\mu} , \boldmath{\Sigma} \right)

まず、XとYを合わせて確率変数ベクトルw、UとVを合わせて確率変数ベクトルZとおきます。wは次の多変量正規分布に従います。

 y \sim N \left( \boldmath{\mu} , \boldmath{\Sigma} \right)
  A X x y {\bf x}

2016年11月に実施された統計検定2級の問題の解説をしています。

 

この記事では、次の6問の解説をしています。下のリストからクリック、またはタップした問題の解説部分へジャンプします。

 

 

問12(回答番号23,24)

■回答番号23

\hat{p}は、X_iの標本平均と考えることができます。X_iはベルヌーイ分布に従うのでV(X_i)=p(1-p)です。これと標本平均の分散の関係を用いると、V( \hat{p})は次のようになります。

 \displaystyle V( \hat{p}) = \frac{p(1-p)}{n}

これは明らかにp= \frac{1}{2}の時に最大値を取り、その値は\frac{1}{4n}です。

 

■回答番号24

対立仮説がp \neq p_0となっていることから、これは両側検定です。有意水準が5%であるため、標準正規分布表より両側で5%、つまり片側が2.5%となるZの値を探すとZ=1.96です。つまり、この検定の棄却域はZ< -1.96 , 1.96 <Zです。以上の事から、|Z|>1.96のときに帰無仮説を棄却すればよい、という検定であることが分かります。

 

 

問13(回答番号25,26,27)

■回答番号25

独立性の検定における期待度数の計算と同様です。総度数は192、夏季の行和は96、「100人以上120人未満」の列和は67であることから、次のように計算できます。

 \displaystyle \frac{96 \times 67}{192} =33.5

 

■回答番号26

二つの階級を併合したため、併合後のクロス集計表は「2行×5列」になります。この表からカイ二乗検定を行う場合、その自由度は(2-1) \times (5-1)=4となります。

 

■回答番号27

カイ二乗分布表より、自由度4のカイ二乗分布の上側5%点は9.49と読み取れます。検定統計量はこれより大きいため、帰無仮説を棄却し「二つの分布は同等であるとは考えられない」と結論付けられます。

 

 

問14(回答番号28)

■回答番号28

対応のあるt検定の検定統計量を、表より数値を読み取って計算します。必要なのは「増分の平均」、「標準偏差」、「サンプルサイズ」です。

 \displaystyle \frac{-13.1 -0}{\frac{19.9}{\sqrt{12}}} \simeq -2.28

これは自由度11のt分布に従います。

 

 

問15(回答番号29,30,31)

■回答番号29

独立に同一の分布に従う標本平均の平均と分散の性質を用いると、\bar{X}の分散は次のように求めることが出来ます。

 \displaystyle  V( \bar{X})=\frac{1}{21} V(X)= \frac{\sigma^2}{21}

 

■回答番号30

有意水準5%の両側検定であることから、標準正規分布表より片側2.5%の点を読み取ります。この値はZ=1.96です。分散が未知の場合には、文中の統計量Tは1標本t検定の検定統計量そのものですから、自由度20のt分布表の両側5%点を読み取ります。この値は2.086です。もし、何らかの仮定のもと正規分布として考えられる場合には、Tは標準正規分布に従います。このとき、棄却域は(ア)と同じものとなります。

 

■回答番号31

Z=0.63における右片側の面積は0.2643です。これは片側のみを考慮した値であるため、両側P値はこの値を2倍します。よって、両側P値は0.5286となります。有意水準よりも大きいため、帰無仮説を棄却することはできません。

 

 

問16(回答番号32,33,34)

■回答番号32

各選択肢の正誤は次の通りです。

  • \textcircled{\scriptsize 1}誤:回帰モデルの自由度は195です。決定係数から算出するものではありません。

  • \textcircled{\scriptsize 2}誤:決定係数は確率的な解釈をする指標ではありません。

  • \textcircled{\scriptsize 3}誤:説明変数と目的変数を入れ替えた結果は逆数になるとは限りません。

  • \textcircled{\scriptsize 4}正:残差の平均値は、常に0になります。

  • \textcircled{\scriptsize 5}誤:単回帰分析の分散分析表は、帰無仮説「傾き=0である」の検定の結果を表します。

 

■回答番号33

残差は「観測値―予測値」で定義されます。これについては、統計学の時間27章の記事も参照してください。

統計学の時間27章「3.予測値と残差」

各選択肢の正誤は次の通りです。

  • \textcircled{\scriptsize 1}正:正しい残差プロットです。

  • \textcircled{\scriptsize 2}誤:元のグラフより、Creが最大の点(右端)と2番目に大きい点を見ると、「Cre最大の点の残差」>「2番目の点の残差」となるはずが、この残差プロットでは同じくらいの値となっているため不適です。

  • \textcircled{\scriptsize 3}誤:符号が逆であるため不適です。

  • \textcircled{\scriptsize 4}誤:Cre=1.4上の2点の残差がどちらも正の値になっていますが、元のグラフと矛盾しているため不適です。

 

■回答番号34

回帰分析では、偏回帰係数の推定量\hat{\beta}について次の統計量Tは自由度n-(偏回帰係数の数)-1のt分布に従います。偏回帰係数の標準誤差をsと表します。

 \displaystyle T = \frac{\hat{\beta} - \beta}{s}

出力結果から推定値と標準誤差を読み取ると、統計量Tは次のようになります。

 \displaystyle T = \frac{-60.263 - \beta}{4.414}

これは自由度195のt分布に従います。自由度nのt分布の左側a%点をt_{\frac{a}{100},195}と表すと、次のように90%信頼区間を構成することができます。

 \displaystyle  t_{0.05,195} \leq \frac{-60.263 - \beta}{4.414} \leq t_{0.95,195}

自由度195のt分布については表にはないので、120か240を代用します。今回は240を用います。他にも、nが十分大きいと見なしてt分布ではなく正規分布を用いることも出来ます。いずれの方法で計算しても結論は大きく変化しません。

 \displaystyle  -1.651 \leq \frac{-60.263 - \beta}{4.414} \leq 1.651 \\ \rightleftarrow -67.55 \leq \beta \leq -52.98

なお、分布の対称性より-t_{0.05,195}=t_{0.95,195}が成立することを使用しています。

 

 

2016年11月問題の解説

  1. その1:問1~問6

  2. その2:問7~問11

  3. その3:問12~問16(本記事)

統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)