- Step1. 基礎編
- 27. 回帰分析
27-7. 重回帰分析の実行ーエクセル統計
重回帰分析について、エクセル統計を用いた場合の実行方法を見ながら、オプションについて解説します。
例題:
次のデータは2015年プロ野球12球団のチーム成績を表したものです。このデータを用い、「打率」、「得点」、「失点」、「防御率」の4つの説明変数をから「勝利数」を予測するための重回帰式を求めます。
- データを選択
- 手法を選択
- 変数の設定
- 変数選択
- 減少法:説明変数をすべて含む回帰式からスタートし、1つずつ変数を減少させていく方法
- 増加法:説明変数を含まない回帰式からスタートし、1つずつ変数を増加させていく方法
- 減増法:説明変数をすべて含む回帰式からスタートし、1つずつ変数を増加させたり減少させたりする方法
- 増減法:説明変数を含まない回帰式からスタートし、1つずつ変数を増加させたり減少させたりする方法
- オプション
- 目的変数:ビールの売上
- 説明変数:気温、雨が降った日数、降水量
- 目的変数:2学期の五科目総合点
- 説明変数:1学期の国語の点数、1学期の数学の点数、1学期の国語と数学の合計点
分析するデータの先頭行を選択します。エクセル統計では列の先頭のセルのみを選択すれば、データの下端まで自動で選択されるためです。
エクセル統計のリボンの中から、「多変量解析」を選びます。さらにその中から、「重回帰分析」を選択します。
手法を選択するとダイアログが表示されます。重回帰分析ではまず、分析する変数を選択する必要があります。
「勝利数」を「目的変数」に、残りの「打率」「本塁打」「得点」「失点」「防御率」を「説明変数」に設定します。変数を設定する際は「>」ボタンを押します。
「変数選択」のタブをクリックすると、重回帰式に含める変数の選択方法を選ぶことができます。「全選択」を選ぶと、説明変数に設定した変数をすべて含む重回帰式が算出されます。
一方、説明変数が多い場合には、P値やF値などを用いて基準を満たす変数のみを含む重回帰式を算出する方法があります。この方法では、基準を満たす変数がなくなった時点で変数選択は終了となり、複数の説明変数の中から効率的に目的変数を説明できる説明変数を選ぶことができます。エクセル統計では4種類の変数選択方法を搭載しています。
「オプション」では、重回帰分析の分析方法の詳細や出力について設定できます。
■線形結合している変数を除いて分析する
説明変数の間に強い相関関係がある場合を多重共線性(マルチコ)があるといいます。例えば次のようなデータを用いて重回帰分析を行おうとした場合、雨が降った日数と降水量の間には強い相関関係があることが予想されます。
このとき、目的変数に対する偏回帰係数の値が不安定(データが増えたり減ったりした場合、あるいは多重共線性のある説明変数の一方を除いた場合に偏回帰係数が大きく変わってしまう場合がある)になり、信頼できない結果となる可能性があります。
このような多重共線性に対する対処法として、相関行列から強い相関の有無をあらかじめ確認し、相関している変数のどれかを外した上で回帰分析を行う方法があります。また、多重共線性がある変数の中には、変数どうしが「線形結合」しているものがあります。ここでいう線形結合とはある変数が別の変数から100%説明できてしまうことを意味します。例えば、次のようなデータでは、1学期の国語と数学の合計点は1学期の国語の点数と数学の点数から100%説明ができます(合計点=国語+数学)。
このような変数を含む場合には、重回帰分析を行うことができません。エクセル統計では「線形結合している変数を除いて分析する」にチェックを入れると、線形結合している変数を自動的に除いた上で解析を行います。
■予測値を出力する
「線形結合している変数を除いて分析する」にチェックを入れると、推定された回帰式から算出される予測値を出力します。
■回帰診断の統計量を出力する
27. 回帰分析
事前に読むと理解が深まる- 学習内容が難しかった方に -
- ブログ
回帰係数と相関係数
- ブログ
Excelで重回帰分析(1)
- ブログ
重回帰分析ができない