【お知らせ】感染症対策に伴うBellCurveの業務状況について 詳細

エクセル統計 搭載機能

Cox(コックス)比例ハザードモデル : Cox Proportional Hazard Model

概要

年齢や性別などの各説明変数x1, x2, …, xp(共変量/予後因子)がハザード関数 h(t|x) に影響をおよぼしているか否かを分析する手法です。ハザード関数は以下の式で表されます。

ここで h0 (t) は説明変数がすべて0のときのハザード関数で、基準ハザード関数やベースラインハザードと呼ばれます。また、a1, a2, …, apは各パラメーターの推定値を示します。

変数選択

本製品では変数選択の方法として、「変数増減法」、「変数減増法」、「変数増加法」、「変数減少法」の4種類の方法が搭載されています。変数選択を利用することで、指定された有意水準の元でハザード関数に与える影響が大きい変数が自動的に選択されます。

生存率曲線

各共変量の最小値を設定した「値A」と各共変量の最大値を設定した「値B」の2つの生存率曲線を1つのグラフで出力します。出力結果の「シミュレーション」欄で各共変量の値を変更でき、変更した値はグラフに反映されます。

モデル診断のためのlog-log生存率曲線

上式で示したハザード関数は、この分析手法を実践するための仮定に過ぎません。このハザード関数が真のハザード関数であるかどうかを確認するためにlog-log(ログマイナスログ、または二重対数)プロットを用います。log-logプロットは、横軸が t、縦軸が log{-log S(t)}のグラフのことです(S(t) は生存関数)。グラフ内の2本の曲線が交わることがなく、上下に平行移動した状態であれば、上式を真のハザード関数とみなせます。

本製品では、ハザード比の中央値でデータ全体を2群に分割し、各群で基準累積ハザードを求めています。出力直後の初期設定では、群1は共変量の最小値、群2は共変量の最大値を用いた場合のlog-log生存率となっています。出力結果の「シミュレーション」欄で各共変量の値を変更すると、連動してグラフの形状も変化します。

分析例ファイルのダウンロード

Cox比例ハザードモデルを使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。

 ex_07_Survival.xlsx

なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。

 無料体験版ダウンロード

処理対象データ

データベース形式

データサイズ範囲 処理対象データ
行数列数数値文字列空白
時間 3~10,000行 1列
状態 3~10,000行 1列
共変量 3~10,000行 1~100列

※:…処理可、×…処理不可、…欠損値として除く

出力内容

ケースの要約 有効ケース、時間のみ不明、状態のみ不明、共変量のみ不明、時間のみ有効、状態のみ有効、共変量のみ有効、いずれも不明、全体の「サンプルサイズ」と「割合」
状態の要約 状態 = 0、状態 = 1、全体の「サンプルサイズ」と「割合」
基本統計量 全体、及び状態ごとの「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「最小値」、「最大値」
線形結合している変数 線形結合している変数を出力します。
変数選択の方法 分析に用いた変数選択方法、投入や除去に用いた検定とその有意水準
変数選択過程 [変数選択の過程を出力する]をオンにした場合に表示されます。
モデル※1 (変数選択のステップごと、もしくは結果の)「-2対数尤度」、「AIC」、モデル全体に対する「スコア検定」の結果、「前のステップからの変化に対する検定」の結果、変数選択過程もしくは最終ステップで投入、除去された変数※1
回帰式に含まれる共変量※1 (変数選択のステップごと、もしくは結果の)回帰式に含まれる共変量の「係数」、「標準誤差」、「Wald検定」もしくは「尤度比検定」の結果、「ハザード比」とその「95%信頼区間」
回帰式に含まれない共変量※1 (変数選択のステップごと、もしくは結果の)回帰式に含まれない共変量の「スコア検定」もしくは「尤度比検定」の結果
シミュレーション

各共変量の任意の値を罫線内に入力することで、推定した係数に基づくハザード比が出力されます。

値A、値Bに値を入力した場合、予測値が「生存率」、「1-生存率」、「累積ハザード」、「log-log生存率」のグラフに反映されます。

また、群1、群2に値を入力した場合、予測値が「モデル診断のためのlog-log生存率」のグラフに反映されます。

値A、もしくは値Aが無いときには群1に値を入力した場合、各共変量の点数が「ノモグラム」のドットに反映されます。

初期設定では値Aと群1には各共変量の最小値が、値Bと群2には各共変量の最大値が指定されています。

【グラフ】生存率※2 推定した偏回帰係数と「値A」と「値B」の値に基づいた生存率のグラフ
【グラフ】1-生存率※3 推定した偏回帰係数と「値A」と「値B」の値に基づいた1-生存率のグラフ
【グラフ】累積ハザード※4 推定した偏回帰係数と「値A」と「値B」の値に基づいた累積ハザードのグラフ
【グラフ】log-log生存率※5 推定した偏回帰係数と「値A」と「値B」の値に基づいたlog-log生存率のグラフ
【グラフ】モデル診断のためのlog-log生存率※6 推定した偏回帰係数と「群1」と「群2」の値に基づいたlog-log生存率のグラフ
【グラフ】ノモグラム※7 推定した偏回帰係数と「基準生存率」の値、および「値A」の値に基づいたノモグラムが出力されます。ただし、[モデル診断のためのlog-log 生存率のグラフを出力する]のみにチェックを入れた場合は「群1」の値に基づいたノモグラムが出力されます。
ケースごとの統計量※8 指定したオプションに応じて、ケースごとの「基準生存率」、「基準累積ハザード」、「生存率」、「累積ハザード」、「log-log生存率」が出力されます。
グラフ用データ グラフ作成用のデータ

※1:ダイアログで[変数選択の過程を出力する]にチェックを入れた場合、ステップごとの値も出力されます。ただし、「回帰式に含まれない変数」は「変数選択過程」にのみ出力されます。

※2:ダイアログで[生存率のグラフを出力する]にチェックを入れた場合に出力します。

※3:ダイアログで[1-生存率のグラフを出力する]にチェックを入れた場合に出力します。

※4:ダイアログで[累積ハザードのグラフを出力する]にチェックを入れた場合に出力します。

※5:ダイアログで[log-log生存率のグラフを出力する]にチェックを入れた場合に出力します。

※6:ダイアログで[モデル診断のためのlog-log生存率のグラフを出力する]にチェックを入れた場合に出力します。

※7:ダイアログで[ノモグラムを出力する]にチェックを入れた場合に出力します。

※8:ダイアログの[オプション]タブでいずれかのケースごとの統計量にチェックを入れた場合に出力します。

Cox比例ハザードモデル(出力:生存率) Cox比例ハザードモデル(出力:1-生存率)Cox比例ハザードモデル(出力:累積ハザード) Cox比例ハザードモデル(出力:log-log生存率) Cox比例ハザードモデル(出力:モデル) Cox比例ハザードモデル(出力:ノモグラム)

参考文献

エクセル統計を使えば、Excelのデータをそのまま簡単に統計解析できます。


生存分析・ハザード分析 その他の手法

搭載機能一覧に戻る