Cox(コックス)比例ハザードモデル : Cox Proportional Hazard Model
概要
年齢や性別などの各説明変数x1, x2, …, xp(共変量/予後因子)がハザード関数 h(t|x) に影響をおよぼしているか否かを分析する手法です。ハザード関数は以下の式で表されます。
ここで h0 (t) は説明変数がすべて0のときのハザード関数で、基準ハザード関数やベースラインハザードと呼ばれます。また、a1, a2, …, apは各パラメーターの推定値を示します。
変数選択
本製品では変数選択の方法として、「変数増減法」、「変数減増法」、「変数増加法」、「変数減少法」の4種類の方法が搭載されています。変数選択を利用することで、指定された有意水準の元でハザード関数に与える影響が大きい変数が自動的に選択されます。
生存率曲線
各共変量の最小値を設定した「値A」と各共変量の最大値を設定した「値B」の2つの生存率曲線を1つのグラフで出力します。出力結果の「シミュレーション」欄で各共変量の値を変更でき、変更した値はグラフに反映されます。
モデル診断のためのlog-log生存率曲線
上式で示したハザード関数は、この分析手法を実践するための仮定に過ぎません。このハザード関数が真のハザード関数であるかどうかを確認するためにlog-log(ログマイナスログ、または二重対数)プロットを用います。log-logプロットは、横軸が t、縦軸が log{-log S(t)}のグラフのことです(S(t) は生存関数)。グラフ内の2本の曲線が交わることがなく、上下に平行移動した状態であれば、上式を真のハザード関数とみなせます。
本製品では、ハザード比の中央値でデータ全体を2群に分割し、各群で基準累積ハザードを求めています。出力直後の初期設定では、群1は共変量の最小値、群2は共変量の最大値を用いた場合のlog-log生存率となっています。出力結果の「シミュレーション」欄で各共変量の値を変更すると、連動してグラフの形状も変化します。
分析例ファイルのダウンロード
Cox比例ハザードモデルを使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
データベース形式
データサイズ範囲 | 処理対象データ | ||||
---|---|---|---|---|---|
行数 | 列数 | 数値 | 文字列 | 空白 | |
時間 | 3~10,000行 | 1列 | ○ | 欠 | 欠 |
状態 | 3~10,000行 | 1列 | ○ | 欠 | 欠 |
共変量 | 3~10,000行 | 1~100列 | ○ | 欠 | 欠 |
※:○…処理可、×…処理不可、欠…欠損値として除く
出力内容
ケースの要約 | 有効ケース、時間のみ不明、状態のみ不明、共変量のみ不明、時間のみ有効、状態のみ有効、共変量のみ有効、いずれも不明、全体の「サンプルサイズ」と「割合」 |
---|---|
状態の要約 | 状態 = 0、状態 = 1、全体の「サンプルサイズ」と「割合」 |
基本統計量 | 全体、及び状態ごとの「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「最小値」、「最大値」 |
線形結合している変数 | 線形結合している変数を出力します。 |
変数選択の方法 | 分析に用いた変数選択方法、投入や除去に用いた検定とその有意水準 |
変数選択過程 | [変数選択の過程を出力する]をオンにした場合に表示されます。 |
モデル※1 | (変数選択のステップごと、もしくは結果の)「-2対数尤度」、「AIC」、モデル全体に対する「スコア検定」の結果、「前のステップからの変化に対する検定」の結果、変数選択過程もしくは最終ステップで投入、除去された変数※1 |
回帰式に含まれる共変量※1 | (変数選択のステップごと、もしくは結果の)回帰式に含まれる共変量の「係数」、「標準誤差」、「Wald検定」もしくは「尤度比検定」の結果、「ハザード比」とその「95%信頼区間」 |
回帰式に含まれない共変量※1 | (変数選択のステップごと、もしくは結果の)回帰式に含まれない共変量の「スコア検定」もしくは「尤度比検定」の結果 |
シミュレーション | 各共変量の任意の値を罫線内に入力することで、推定した係数に基づくハザード比が出力されます。 値A、値Bに値を入力した場合、予測値が「生存率」、「1-生存率」、「累積ハザード」、「log-log生存率」のグラフに反映されます。 また、群1、群2に値を入力した場合、予測値が「モデル診断のためのlog-log生存率」のグラフに反映されます。 値A、もしくは値Aが無いときには群1に値を入力した場合、各共変量の点数が「ノモグラム」のドットに反映されます。 初期設定では値Aと群1には各共変量の最小値が、値Bと群2には各共変量の最大値が指定されています。 |
【グラフ】生存率※2 | 推定した偏回帰係数と「値A」と「値B」の値に基づいた生存率のグラフ |
【グラフ】1-生存率※3 | 推定した偏回帰係数と「値A」と「値B」の値に基づいた1-生存率のグラフ |
【グラフ】累積ハザード※4 | 推定した偏回帰係数と「値A」と「値B」の値に基づいた累積ハザードのグラフ |
【グラフ】log-log生存率※5 | 推定した偏回帰係数と「値A」と「値B」の値に基づいたlog-log生存率のグラフ |
【グラフ】モデル診断のためのlog-log生存率※6 | 推定した偏回帰係数と「群1」と「群2」の値に基づいたlog-log生存率のグラフ |
【グラフ】ノモグラム※7 | 推定した偏回帰係数と「基準生存率」の値、および「値A」の値に基づいたノモグラムが出力されます。ただし、[モデル診断のためのlog-log 生存率のグラフを出力する]のみにチェックを入れた場合は「群1」の値に基づいたノモグラムが出力されます。 |
ケースごとの統計量※8 | 指定したオプションに応じて、ケースごとの「基準生存率」、「基準累積ハザード」、「生存率」、「累積ハザード」、「log-log生存率」が出力されます。 |
グラフ用データ | グラフ作成用のデータ |
※1:ダイアログで[変数選択の過程を出力する]にチェックを入れた場合、ステップごとの値も出力されます。ただし、「回帰式に含まれない変数」は「変数選択過程」にのみ出力されます。
※2:ダイアログで[生存率のグラフを出力する]にチェックを入れた場合に出力します。
※3:ダイアログで[1-生存率のグラフを出力する]にチェックを入れた場合に出力します。
※4:ダイアログで[累積ハザードのグラフを出力する]にチェックを入れた場合に出力します。
※5:ダイアログで[log-log生存率のグラフを出力する]にチェックを入れた場合に出力します。
※6:ダイアログで[モデル診断のためのlog-log生存率のグラフを出力する]にチェックを入れた場合に出力します。
※7:ダイアログで[ノモグラムを出力する]にチェックを入れた場合に出力します。
※8:ダイアログの[オプション]タブでいずれかのケースごとの統計量にチェックを入れた場合に出力します。