BellCurve 統計WEB

ブログ

令和元年 公認会計士試験論文式試験(統計学)第8問 問題3

2021/07/01

カテゴリ:

下記のリンクからそれぞれの問題の解説に飛ぶことができます。

問1

推定値は回帰式を用いて算出します。X=12D=1のとき、推定値\widehat{Y}は次のように計算できます。

 \displaystyle \widehat{Y} = 193.763 + 5.254 \times 12 + 76.578 \times 1 = 333.389

また、「残差」は実際のデータを用いて推定された回帰式から算出される値と実際のデータとの差を表します。したがって、

 \displaystyle e = 334.8 - 333.389 = 1.411

となります。

問2

R^2で表される決定係数が0.953であることが分かっているので、この値を使います。決定係数は「回帰変動が全変動に対してどれだけ多いか=残差変動が全変動に対してどれだけ少ないか」を表すものです。各変動は

  • 「全変動」:実際のデータとデータ全体の平均値との差
  • 「回帰変動」:推定された回帰式から得られた予測値とデータ全体の平均値の差
  • 「残差変動」:実際のデータと推定された回帰式から得られた予測値との差

を意味します。これらの変動は二乗和として算出します。「全変動の平方和」は「偏差平方和」のことです。

決定係数は「回帰変動の平方和/偏差平方和」もしくは「1-残差平方和/偏差平方和」から算出できます。ここでは残差平方和をSSRとおき、

 \displaystyle 0.953 = 1-\frac{SSR}{90230.90}

を解いて、求める残差平方和は4240.85となります。

問3

  1. 仮説を立てる
  2. 帰無仮説は「性別を表すダミー変数の偏回帰係数は0である」とします。したがって、対立仮説は「性別を表すダミー変数の偏回帰係数は0ではない」とします。

  3. 適切な検定統計量を決める
  4. 偏回帰係数の検定では統計量tを使います。次の式から算出される統計量t(t値)が自由度(n-k-1)のt分布に従うことを用います。\widehat{\beta}は偏回帰係数を、nはサンプルサイズを、kは説明変数の数を表します。

     \displaystyle t = \frac{\widehat{\beta}-0}{se(\widehat{\beta})}
  5. 棄却ルールを決める
  6. この検定で使用する分布は自由度「18-2-1=15」の「t分布」です。また、性別を表すダミー変数の偏回帰係数は0であるを調べることが目的なので、両側検定を行います。統計数値表からt_{0.025}(15)の値を読み取ると「2.131」となっています。つまり、棄却域は|t|\geq2.131となります。

  7. 検定統計量を元に結論を出す
  8.  \displaystyle t = \frac{76.578-0}{7.927} = 9.66

    t=9.66は棄却域に入っていることから、「有意水準5%において、帰無仮説を棄却し、対立仮説を採択する」という結果になります。つまり、「性別を表すダミー変数の偏回帰係数は0ではない」=性別を表すダミー変数の偏回帰係数が0を超えることから「女性に比べて男性の方が有意に所定内給与額が高い」と結論づけられます。

問4

XDは勤続年数とダミー変数の交互作用項です。交互作用は2つの因子が組み合わさることで初めて現れる相乗効果のことです。この問題の場合、勤続年数とダミー変数が相互に影響を及ぼし合っていることを表します。

まず、XDの偏回帰係数の検定を行います。この検定で使用する分布は自由度「(9-1)(2-1)=8」の「t分布」です。棄却域は|t|\geq2.306です。

 \displaystyle t = \frac{2.349-0}{0.409} = 5.74

であることから、この交互作用項XDは有意であることがわかります。したがって、男女で所定内給与額の伸びが異なっており、さらにXDの偏回帰係数が正であることから男性の方がその伸び方が大きいということがわかります。

問5

重回帰分析で説明変数を増やしていくと決定係数は次第に1に近づいていきます。例えば同じサンプルのデータで、説明変数が3個と4個の2通りの重回帰分析を行った場合、説明変数を4個にした方が決定係数は高くなります。決定係数が高くなったのが説明変数の数を増やしただけの効果によるものか、増やした以上の効果があったのかを見たいとき、自由度修正済決定係数を比較します。説明変数を増やした場合の調整済み決定係数の方が高ければ、説明変数を増やしたことにより重回帰式の精度が良くなったと評価できます。

決定係数も自由度修正済決定係数もともに「回帰分析の結果②」のほうが高いことから、②のモデルのほうが所定内給与額をよく説明できていることがわかります。


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)