令和元年 公認会計士試験論文式試験(統計学)第8問 問題3
2021/07/01
カテゴリ:公認会計士(統計学)
下記のリンクからそれぞれの問題の解説に飛ぶことができます。
問1
推定値は回帰式を用いて算出します。、のとき、推定値は次のように計算できます。
また、「残差」は実際のデータを用いて推定された回帰式から算出される値と実際のデータとの差を表します。したがって、
となります。
問2
で表される決定係数が0.953であることが分かっているので、この値を使います。決定係数は「回帰変動が全変動に対してどれだけ多いか=残差変動が全変動に対してどれだけ少ないか」を表すものです。各変動は
- 「全変動」:実際のデータとデータ全体の平均値との差
- 「回帰変動」:推定された回帰式から得られた予測値とデータ全体の平均値の差
- 「残差変動」:実際のデータと推定された回帰式から得られた予測値との差
を意味します。これらの変動は二乗和として算出します。「全変動の平方和」は「偏差平方和」のことです。
決定係数は「回帰変動の平方和/偏差平方和」もしくは「1-残差平方和/偏差平方和」から算出できます。ここでは残差平方和をSSRとおき、
を解いて、求める残差平方和は4240.85となります。
問3
- 仮説を立てる
- 適切な検定統計量を決める
- 棄却ルールを決める
- 検定統計量を元に結論を出す
帰無仮説は「性別を表すダミー変数の偏回帰係数は0である」とします。したがって、対立仮説は「性別を表すダミー変数の偏回帰係数は0ではない」とします。
偏回帰係数の検定では統計量tを使います。次の式から算出される統計量t(t値)が自由度のt分布に従うことを用います。は偏回帰係数を、nはサンプルサイズを、kは説明変数の数を表します。
この検定で使用する分布は自由度「18-2-1=15」の「t分布」です。また、性別を表すダミー変数の偏回帰係数は0であるを調べることが目的なので、両側検定を行います。統計数値表からの値を読み取ると「2.131」となっています。つまり、棄却域はとなります。
は棄却域に入っていることから、「有意水準5%において、帰無仮説を棄却し、対立仮説を採択する」という結果になります。つまり、「性別を表すダミー変数の偏回帰係数は0ではない」=性別を表すダミー変数の偏回帰係数が0を超えることから「女性に比べて男性の方が有意に所定内給与額が高い」と結論づけられます。
問4
は勤続年数とダミー変数の交互作用項です。交互作用は2つの因子が組み合わさることで初めて現れる相乗効果のことです。この問題の場合、勤続年数とダミー変数が相互に影響を及ぼし合っていることを表します。
まず、の偏回帰係数の検定を行います。この検定で使用する分布は自由度「(9-1)(2-1)=8」の「t分布」です。棄却域はです。
であることから、この交互作用項は有意であることがわかります。したがって、男女で所定内給与額の伸びが異なっており、さらにの偏回帰係数が正であることから男性の方がその伸び方が大きいということがわかります。
問5
重回帰分析で説明変数を増やしていくと決定係数は次第に1に近づいていきます。例えば同じサンプルのデータで、説明変数が3個と4個の2通りの重回帰分析を行った場合、説明変数を4個にした方が決定係数は高くなります。決定係数が高くなったのが説明変数の数を増やしただけの効果によるものか、増やした以上の効果があったのかを見たいとき、自由度修正済決定係数を比較します。説明変数を増やした場合の調整済み決定係数の方が高ければ、説明変数を増やしたことにより重回帰式の精度が良くなったと評価できます。
決定係数も自由度修正済決定係数もともに「回帰分析の結果②」のほうが高いことから、②のモデルのほうが所定内給与額をよく説明できていることがわかります。