傾向スコアマッチング : Propensity Score Matching
概要
観察研究など、無作為割り付けができない状況において処置効果を推定するためには、交絡の調整が必要です。 傾向スコアマッチングはそのような際に用いる調整方法のひとつで、処置群における効果(ATT:Average Treatment Effect on the Treated)を推定することが可能です。
エクセル統計における傾向スコアマッチングでは、貪欲1vs1マッチングによる傾向スコアマッチングを実行できます。傾向スコアを推定する際に使用した共変量を指定することで、マッチングしたペアにおいて共変量がバランスしているかを確認することもできます。
分析例ファイルのダウンロード
傾向スコアマッチングを使用する際のダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
データベース形式
データサイズ範囲 | 処理対象データ | ||||
---|---|---|---|---|---|
行数 | 列数 | 数値 | 文字列 | 空白 | |
傾向スコア | 4~60,000行 | 1列 | ○※1 | 欠 | 欠 |
割り付け変数 | 4~60,000行 | 1列 | ○※2 | 欠 | 欠 |
共変量※3 | 4~60,000行 | 1~100列 | ○ | 欠 | 欠 |
目的変数※3 | 4~60,000行 | 1列 | ○ | 欠 | 欠 |
ラベル※3 | 4~60,000行 | 1列 | ○ | ○ | ○ |
※:○…処理可、×…処理不可、欠…欠損値として除く
※1:傾向スコアは0から1までの値であること
※2:割り付けは0か1の値であること
※3:共変量、目的変数、ラベルは未入力でも処理可
出力内容
ケースの要約 | 有効ケースと、不明な変数が存在するデータの「サンプルサイズ」と「割合」 |
---|---|
割り付けの要約 | 割り付け変数の値が「0」と「1」のサンプルサイズと、コモンサポート内で割り付け変数の値が「0」と「1」のサンプルサイズ |
基本統計量 | 傾向スコア、共変量、目的変数の「サンプルサイズ」、「平均」、「分散」、「標準偏差」、「最大値」、「最小値」 |
マッチング設定 | ダイアログで設定した「ロジット変換」、「コモンサポート」、「キャリパー」、「マッチングの順番」 |
割り付け変数で層別した基本統計量 | マッチング前のデータを割り付け変数の値が「0」と「1」で層別した傾向スコア、共変量、目的変数の「サンプルサイズ」、「平均」、「分散」、「標準偏差」、「最大値」、「最小値」 |
目的変数の差の平均値※1 | マッチングが成立したペアにおける目的変数の差の平均値 |
マッチングバランス※2 | 元データ、コモンサポート内データ、マッチング後データにおける共変量の「差の平均値」、「標準化した差の平均値」、「バイアスの減少率」、「分散比」 |
検定結果※2 | マッチング前のデータにおける共変量の「ウェルチのt検定」と「ブルンナー=ムンツェル検定」の結果。マッチング後のデータにおける「対応のあるt検定」と「ウィルコクソンの符号つき順位検定」の結果、または「ウェルチのt検定」と「ブルンナー=ムンツェル検定」の結果。 |
標準化した平均値の差※2 | 表側を目的変数の観測値、表頭を目的変数の「予測値」としたクロス集計表。目的変数の0/1と全体についての「判別的中率」も出力されます。 |
マッチしたペア | 元データ、コモンサポート内データ、マッチング後データにおける共変量の標準化した差の平均値のグラフ |
マッチング前後での分布の変化※2 | 元データとマッチング後データにおける傾向スコア、共変量のカーネル密度曲線 |
※1:目的変数を指定した場合に出力します。
※2:ダイアログで[マッチングバランスを出力する]にチェックを入れた場合に出力します。