BellCurve 統計WEB

  • Step1. 初級編
  • 27. 回帰分析

27-2. 重回帰分析

重回帰分析は複数の説明変数x_{i}(i=1, 2, 3, ・・・)を用いて目的変数yを表す回帰式を算出することです。例えば、次のようなデータについて考えてみます。

図1

【出典:総務省統計局 社会生活統計指標-都道府県の指標-2015】

このデータでは年日照時間を目的変数yとし、残りの4変数を説明変数とします。年平均気温をx_{1}、人口密度をx_{2}、持ち家比率をx_{3}、降水量をx_{4}とするとき、次のような重回帰式を求めることを考えます。

 \displaystyle y=\beta_{0}+\beta_{1}x_{1}+\beta_{2}x_{2}+\beta_{3}x_{3}+\beta_{4}x_{4}

重回帰分析の偏回帰係数も、単回帰分析と同様に最小二乗法で求めます。このデータを用いてエクセル統計で重回帰分析を行うと、偏回帰係数について次のような結果が得られます。

図2

■偏回帰係数

偏回帰係数は上で示した式の\beta_{i}(i=0, 1, 2, 3, 4)の推定値です。定数項は切片のことで、\beta_{0}の値を示します。これらの値から、重回帰式は次のようになります。

 \displaystyle \widehat{y}=538.7+77.2x_{1}+0.04x_{2}+11.2x_{3}-0.26x_{4}

■標準偏回帰係数

標準偏回帰係数は、説明変数および目的変数をそれぞれ準化した標準化した値から算出される偏回帰係数のことです。標準化偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。

例えば上に示したデータの場合、人口密度の標準偏回帰係数0.19と比較して年平均気温0.72の方が大きいことから、年平均気温の方が目的変数に与える影響が大きいことが分かります。ただし、通常の偏回帰係数ではその大小から各変数の重要性を判断することはできません。

■偏回帰係数の有意性の検定

偏回帰係数の有意性の検定とは、定数項も含めた各偏回帰係数が統計的に0であるかについての検定結果です。帰無仮説は「偏回帰係数=0」です。偏回帰係数を標準誤差で割った値について、自由度n-k-1のt分布を用いて検定を行います。nはサンプルサイズを、kは説明変数の数を表します。この検定により有意となった場合、偏回帰係数は0ではない、すなわちその説明変数の目的変数に対する影響は統計的に有意であると言うことができます。

27. 回帰分析

事前に読むと理解が深まる- 学習内容が難しかった方に -