二項ロジスティック回帰分析 : Binomial Logistic Regression Analysis
概要
病気の発生リスクのような疫学データの分析やDMの反応予測のようなマーケティング・データの分析などに利用できます。説明変数には年齢、年収といった量的変数と、性別、購入経験といった質的変数を混在できます。
目的変数の値は事象(イベント)が起こった場合に1、起こらなかった場合に0としてください。0/1の2値型であっても0から1までの値を取る連続型であっても構いません。p個の変数がある場合に目的変数が1をとる確率をπとすると、ロジスティック回帰式は以下の式で表されます。0/1の2値データをロジット変換(オッズの対数)することで、連続データに変換し回帰分析を行います。
b1, b2, …, bpは偏回帰係数を、b0は定数項を表します。また、x1, x2, …, xpは説明変数を表します。説明変数に3カテゴリー以上の質的変数がある場合は、「ダミー変数への変換」を用いるなどして0/1 データに変換してから分析を行ってください。ただし、k個のカテゴリーの質的変数からダミー変数を生成した場合、分析にはその中のk-1個のダミー変数を利用してください。
注意事項
ワークシートに計算式を出力するため、「計算方法」が「手動」の場合は「自動」に変更されます。
分析例ファイルのダウンロード
二項ロジスティック回帰分析を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
データベース形式
データサイズ範囲 | 処理対象データ | ||||
---|---|---|---|---|---|
行数 | 列数 | 数値 | 文字列 | 空白 | |
目的変数 | 3~60,000行 | 1列 | ○※1 | 欠 | 欠 |
説明変数 | 3~60,000行 | 1~100列 | ○ | 欠 | 欠 |
度数※2 | 3~60,000行 | 1列 | ○ | 欠 | 欠 |
※:○…処理可、×…処理不可、欠…欠損値として除く
※1:目的変数は0から1までの値であること
※2:度数の和(データ件数の合計)が60,000 以下であること
出力内容
度数の要約 | 有効ケース、無効ケース、全体の「サンプルサイズ」と「割合」が出力されます。度数を設定した場合にのみ出力されます。 |
---|---|
ケースの要約 | 有効ケース、目的変数のみ不明、説明変数のみ不明、ともに不明、全体の「サンプルサイズ」と「割合」 |
目的変数の要約 | 目的変数の全体と各群における「サンプルサイズ」と「割合」 |
基本統計量 | 説明変数と目的変数の各変数の「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「最小値」、「最大値」 |
相関行列 | 目的変数の全体と各群における説明変数間の相関係数の行列 |
線形結合している変数 | 説明変数間で線形結合している変数のリスト |
変数選択の方法 | 変数選択に用いた方法と変数選択の基準値 |
回帰式の精度※1 | 変数選択過程もしくは最終ステップにおける回帰式の「-2対数尤度」、「AIC」、「R2乗」、「Cox-Snell R2乗」、「Nagelkerke R2乗」、「(目的変数の観測値と予測値の)相関係数」、「誤判別率」※3、変数選択の結果各ステップで投入、除去された変数※1 |
回帰式の有意性※1 | 変数選択過程もしくは最終ステップの回帰式の尤度比検定の結果 |
回帰式に含まれる変数(偏回帰係数・信頼区間等)※1 | 変数選択過程もしくは最終ステップの回帰式に含まれる各説明変数の「偏回帰係数」、「標準誤差」、「標準偏回帰係数」、「偏回帰係数の95%信頼区間」、「オッズ比」、「オッズ比の95%信頼区間」、「偏回帰係数の有意性の検定」の結果 |
回帰式に含まれない変数※1 | 変数選択過程もしくは最終ステップの回帰式に含まれない各説明変数を回帰式に投入した場合の有意性を検定した結果 |
分類表※1※2 | ステップごとの、表側を観測値の0/1、表頭を予測値の0/1とした2行×2列のクロス集計表。「判別的中率」も出力されます。 |
シミュレーション | 各説明変数の任意の値を罫線内に入力することで、各説明変数のオッズ比と目的変数の予測値をシミュレーションすることができます。 |
【グラフ】観測値×予測値 | X軸に観測値、Y軸に予測値をプロットした散布図 |
【グラフ】残差プロット | 各ケースの残差(観測値と予測値の差)をプロットした散布図 |
予測値※3 | 目的変数の「観測値」と回帰式から算出された「予測値」 |
回帰診断※4 | 予測値と観測値との残差の分析として、「残差」、「標準化残差」、「スチューデント化残差」を出力します。影響力の分析として、「Cookの距離」と「てこ比」を出力します。 |
※1:ダイアログで[変数選択の過程を出力する]にチェックを入れた場合、ステップごとの値も出力します。ただし、「回帰式に含まれない変数」は「変数選択過程」にのみ出力されます。
※2:目的変数の値が0/1の2値型の場合に出力します。
※3:ダイアログで[予測値を出力する]にチェックを入れた場合に出力します。
※4:ダイアログで[回帰診断の統計量を出力する]にチェックを入れた場合に出力します。