二項ロジスティック回帰分析 : Binomial Logistic Regression Analysis
概要
病気の発生リスクのような疫学データの分析やDMの反応予測のようなマーケティング・データの分析などに利用できます。説明変数には年齢、年収といった量的変数と、性別、購入経験といった質的変数を混在できます。
目的変数の値は事象(イベント)が起こった場合に1、起こらなかった場合に0としてください。0/1の2値型であっても0から1までの値を取る連続型であっても構いません。p個の変数がある場合に目的変数が1をとる確率をπとすると、ロジスティック回帰式は以下の式で表されます。0/1の2値データをロジット変換(オッズの対数)することで、連続データに変換し回帰分析を行います。

b1, b2, …, bpは偏回帰係数を、b0は定数項を表します。また、x1, x2, …, xpは説明変数を表します。説明変数に3カテゴリー以上の質的変数がある場合は、「ダミー変数への変換」を用いるなどして0/1 データに変換してから分析を行ってください。ただし、k個のカテゴリーの質的変数からダミー変数を生成した場合、分析にはその中のk-1個のダミー変数を利用してください。
注意事項
ワークシートに計算式を出力するため、「計算方法」が「手動」の場合は「自動」に変更されます。
分析例ファイルのダウンロード
二項ロジスティック回帰分析を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
データベース形式
データサイズ範囲 | 処理対象データ | ||||
---|---|---|---|---|---|
行数 | 列数 | 数値 | 文字列 | 空白 | |
目的変数 | 3~60,000行 | 1列 | ○※1 | 欠 | 欠 |
説明変数 | 3~60,000行 | 1~100列 | ○ | 欠 | 欠 |
度数※2 | 3~60,000行 | 1列 | ○ | 欠 | 欠 |
※:○…処理可、×…処理不可、欠…欠損値として除く
※1:目的変数は0から1までの値であること
※2:度数の和(データ件数の合計)が60,000 以下であること
設定項目
Excelの[エクセル統計]タブから、[多変量解析]→[二項ロジスティック回帰分析]を選択すると以下のダイアログが表示されます。
「変数」タブ
- データ入力範囲 必須
- データ入力範囲の変更を行う場合、[変更]ボタンを選択します。データ入力範囲のダイアログが表示されるので、データ入力範囲を設定して [戻る] ボタンを選択します。なお、データ入力範囲の先頭行は変数名となります。
- 目的変数 必須
- [変数リスト]から目的変数とする変数を設定します。
- 説明変数 必須
- [変数リスト]から説明変数とする変数を設定します。
- 度数
- [変数リスト]から度数に用いる変数を設定します。
目的変数と説明変数のいずれかに「空白」や「文字」が入力されているケースは分析対象から除かれ、目的変数と説明変数が全て揃っているケースが分析対象となります。ただし、説明変数がすべて入力されていれば予測値の計算は行います。
「変数選択」タブ
- 方法
- [全変数]、[増減法]、[減増法]、[増加法]、[減少法]の5つから選択します。初期設定は[全変数]です。
- 基準
- 変数選択を行う場合、変数選択の基準となる [P値] を指定します。[増減法]、[減増法]、[増加法]のいずれかを選択した場合、変数投入の基準値を [投入] テキストボックスに指定します。[増減法]、[減増法]、[減少法] のいずれかを選択した場合、変数除去の基準値を [除去] テキストボックスに指定します。P値は0.0001以上0.9999以下の値を入力してください。
- 変数選択の過程を出力する
- 変数選択の過程を出力する場合、このチェックボックスをオンにします。初期設定はオフです。
「オプション」タブ
- 線形結合している変数を除いて分析する
- 線形結合している変数を最初に除いてから分析する場合、このチェックボックスをオンにします。初期設定はオンです。
- 定数項を0とする
- 定数項を0として二項ロジスティック回帰式の推定を行う場合、このチェックボックスをオンにします。初期設定はオフです。
- 予測値を出力する
- 分析により得られた偏回帰係数を説明変数にあてはめた予測値を出力する場合、このチェックボックスをオンにします。初期設定はオフです。
- 回帰診断の統計量を出力する
- [予測値を出力する] がオンのときに指定できます。
- 反復回数の上限
- 二項ロジスティック回帰分析の偏回帰係数は最尤法により推定しています。推定の反復回数の上限を指定します。初期設定は50回です。
- ROC 曲線を出力する
- 二項ロジスティック回帰分析による予測値を元にROC曲線を出力する場合、このチェックボックスをオンにします。[予測値を出力する] がオンのときに指定できます。
- ノモグラムを出力する
- 二項ロジスティック回帰分析による予測値を元にノモグラムを出力する場合、このチェックボックスをオンにします。[予測値を出力する] がオンのときに指定できます。
出力内容
度数の要約 | 有効ケース、無効ケース、全体の「サンプルサイズ」と「割合」が出力されます。度数を設定した場合にのみ出力されます。 |
---|---|
ケースの要約 | 有効ケース、目的変数のみ不明、説明変数のみ不明、ともに不明、全体の「サンプルサイズ」と「割合」 |
目的変数の要約 | 目的変数の全体と各群における「サンプルサイズ」と「割合」 |
基本統計量 | 説明変数と目的変数の各変数の「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「最小値」、「最大値」 |
相関行列 | 目的変数の全体と各群における説明変数間の相関係数の行列 |
線形結合している変数 | 説明変数間で線形結合している変数のリスト |
変数選択の方法 | 変数選択に用いた方法と変数選択の基準値 |
回帰式の精度※1 | 変数選択過程もしくは最終ステップにおける回帰式の「-2対数尤度」、「AIC」、「R2乗」、「Cox-Snell R2乗」、「Nagelkerke R2乗」、「(目的変数の観測値と予測値の)相関係数」、「誤判別率」※3、変数選択の結果各ステップで投入、除去された変数※1 |
回帰式の有意性※1 | 変数選択過程もしくは最終ステップの回帰式の尤度比検定の結果 |
回帰式に含まれる変数(偏回帰係数・信頼区間等)※1 | 変数選択過程もしくは最終ステップの回帰式に含まれる各説明変数の「偏回帰係数」、「標準誤差」、「標準偏回帰係数」、「偏回帰係数の95%信頼区間」、「オッズ比」、「オッズ比の95%信頼区間」、「偏回帰係数の有意性の検定」の結果 |
回帰式に含まれない変数※1 | 変数選択過程もしくは最終ステップの回帰式に含まれない各説明変数を回帰式に投入した場合の有意性を検定した結果 |
分類表※1※2 | ステップごとの、表側を観測値の0/1、表頭を予測値の0/1とした2行×2列のクロス集計表。「判別的中率」も出力されます。 |
シミュレーション | 各説明変数の任意の値を罫線内に入力することで、各説明変数のオッズ比と目的変数の予測値をシミュレーションすることができます。 |
【グラフ】観測値×予測値 | X軸に観測値、Y軸に予測値をプロットした散布図 |
【グラフ】残差プロット | 各ケースの残差(観測値と予測値の差)をプロットした散布図 |
予測値※3 | 目的変数の「観測値」と回帰式から算出された「予測値」 |
回帰診断※4 | 予測値と観測値との残差の分析として、「残差」、「標準化残差」、「スチューデント化残差」を出力します。影響力の分析として、「Cookの距離」と「てこ比」を出力します。 |
※1:ダイアログで[変数選択の過程を出力する]にチェックを入れた場合、ステップごとの値も出力します。ただし、「回帰式に含まれない変数」は「変数選択過程」にのみ出力されます。
※2:目的変数の値が0/1の2値型の場合に出力します。
※3:ダイアログで[予測値を出力する]にチェックを入れた場合に出力します。
※4:ダイアログで[回帰診断の統計量を出力する]にチェックを入れた場合に出力します。

