BellCurve 統計WEB

ブログ

ROC曲線─エクセル統計による解析事例

2017/04/19

カテゴリ:

※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。

分析データ

下図は、45人の患者を対象に行った2種類の検査の結果と疾患の有無のデータです。エクセル統計を用いてROC曲線を作成することで、2つの検査の性能を比較します。

2種類の検査の性能比較データ

ダイアログの設定

下図のようにセル範囲「B3:C3」を選択後、[Ctrl]キーを押しながらセル「D3」を選択します。メニューより[エクセル統計]→[管理図・ROC曲線]→[ROC曲線]を選択します。

データ範囲の先頭行を選択

ダイアログが表示される際、セル範囲「B3:C48」が[検査データ範囲]に、セル範囲「D3:D48」が[状態データ範囲]に自動で指定されます。このまま[OK]をクリックして結果を出力します。

[ROC曲線]ダイアログ

基本統計量

各検査ごとに疾患ありのデータと疾患なしのデータのそれぞれについて、サンプルサイズ、平均、不偏分散、標準偏差、最小値、最大値が出力されます。

基本統計量

ROC曲線

以下のようなROC曲線が出力されます。縦軸のTPF(True Positive Fraction)は真陽性率であり、感度を表します。横軸のFPF(False Positive Fraction)は偽陽性率であり、1-特異度を表します。

ROC曲線

ROC曲線下の面積

各検査のROC曲線下の面積が出力されます。AUC(Area Under the Curve)またはAzで表され、値が1に近いほど判別の性能が良いことを表します。今回のデータでは、検査Aは「0.9089」、検査Bは「0.7511」となり、検査Aは検査Bよりも性能が良さそうです。

ROC曲線下の面積

ROC曲線下の面積の比較

帰無仮説「検査1のAUC = 検査2のAUC」について、カイ二乗検定を行った結果が出力されます。検定の結果P値は0.0009なので、有意水準5%で帰無仮説は棄却されます。従って、検査1と検査2のAUCには差があると言えそうです。

ROC曲線下の面積の比較

ROC曲線データ

ROC曲線の各基準点ごとのFPF、TPF、オッズ比が出力されます。ROC曲線のグラフ用データとして用いられています。

ROC曲線データ

各基準点で以下のようなクロス集計表を作成し、TPF、FPF、オッズ比を計算します。

TPFとFPFとオッズ比を求める数式
疾患合計
ありなし
検査値基準点より小さいa (真陽性)b (偽陽性)a+b
基準点より大きいc (偽陰性)d (真陰性)c+d
合計a+cb+da+b+c+d

左上隅から最も近い点

ROC曲線において左上隅の座標(0, 1)から最も近い点が出力されます。カットオフ値の候補となります。

左上隅から最も近い点

斜線から最も離れた点

ROC曲線において斜線から最も離れた点が出力されます。カットオフ値の候補となります。

斜線から最も離れた点

※ 掲載している画像は、エクセル統計による出力後に一部書式設定を行ったものです。

ダウンロード

この解析事例のExcel ファイルのダウンロードはこちらから → example_25.xlsx

このファイルは、エクセル統計の体験版に対応しています。

関連リンク


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)