BellCurve 統計WEB

ブログ

重回帰分析ができない

2017/08/13

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら


エクセル統計のサポートをしていると、たまに次のような問い合わせを受けることがあります。

「重回帰分析ができないのはどうして?」

ほとんどのケースは変数間の「線形結合(linear combination)」が原因です。よくあるのは、変数の中に合計点を入れてしまうケースです。

 国語、数学、英語、3科目の合計

線形結合は変数の和だけではなく、変数を定数倍したときにも生じます。

 秒速、分速(=60×秒速)

線形結合は、ある変数が別の変数から100%説明できてしまうことを意味します。線形結合は次のとおり一次式で関係を表現できるので「一次結合」ともいいます。

 (1)変数A = 1.5×変数B
 (2)変数C = 変数D +変数E + 変数F
 (3)変数G = 100 + 5×変数H + 3×変数J

重回帰分析を行うとき、最初に、すべての変数の相関係数を求めて相関行列を作成します。続いて、相関行列の逆行列を求める処理をします。線形結合があると逆行列が計算できなくなり分析を続けられません。

(1)のように、2変数間で線形結合を起こしている場合は、2変数間の相関係数が「1」か「−1」になるから簡単に見つけられます。どちらか一方の変数を外して分析を行ってください。

(2)(3)は、自分で関係式を組んでなければ見つけるのがやっかいです。関係式がわかっているなら、通常は、右辺か左辺、どちらの変数を外します。個々の変数の変動要因や、変動の幅、説明変数間の因果関係、目的変数への影響を吟味して外してください。

例えば、摂取カロリーが肥満に与える影響を分析するとして、朝昼晩、3食の摂取カロリーのデータがあったとします。この場合、朝昼晩の3食のカロリーと、3食合計のカロリーを同時に説明変数に用いることはできません。どの変数を残すかといえば、3食合計が妥当ではないでしょうか。理由は、朝昼晩の間で相関関係が想定でき(大食いの人は、どの食事も大食いになるのでは)、重回帰分析ができても多重共線性の心配をしなければなりません。