傾向スコアマッチング : Propensity Score Matching
概要
観察研究など、無作為割り付けができない状況において処置効果を推定するためには、交絡の調整が必要です。 傾向スコアマッチングはそのような際に用いる調整方法のひとつで、処置群における効果(ATT:Average Treatment Effect on the Treated)を推定することが可能です。
エクセル統計における傾向スコアマッチングでは、貪欲1vs1マッチングによる傾向スコアマッチングを実行できます。傾向スコアを推定する際に使用した共変量を指定することで、マッチングしたペアにおいて共変量がバランスしているかを確認することもできます。
分析例ファイルのダウンロード
傾向スコアマッチングを使用する際のダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
データベース形式
データサイズ範囲 | 処理対象データ | ||||
---|---|---|---|---|---|
行数 | 列数 | 数値 | 文字列 | 空白 | |
傾向スコア | 4~60,000行 | 1列 | ○※1 | 欠 | 欠 |
割り付け変数 | 4~60,000行 | 1列 | ○※2 | 欠 | 欠 |
共変量※3 | 4~60,000行 | 1~100列 | ○ | 欠 | 欠 |
目的変数※3 | 4~60,000行 | 1列 | ○ | 欠 | 欠 |
ラベル※3 | 4~60,000行 | 1列 | ○ | ○ | ○ |
※:○…処理可、×…処理不可、欠…欠損値として除く
※1:傾向スコアは0から1までの値であること
※2:割り付けは0か1の値であること
※3:共変量、目的変数、ラベルは未入力でも処理可
設定項目
Excelの[エクセル統計]タブから、[ユーティリティ]→[傾向スコアマッチング]を選択すると以下のダイアログが表示されます。
「変数」タブ
- データ入力範囲 必須
- データ入力範囲の変更を行う場合、[変更]ボタンを選択します。データ入力範囲のダイアログが表示されるので、データ入力範囲を設定して[戻る]ボタンを選択します。なお、データ入力範囲の先頭行は変数名となります。
- 傾向スコア 必須
- [変数リスト]から傾向スコアとする変数を設定します。
- 割り付け 必須
- [変数リスト]から割り付けとする変数を設定します。
- 共変量
- [変数リスト]から共変量とする変数を設定します。
- 目的変数
- [変数リスト]から目的変数とする変数を設定します。
- ラベル
- [変数リスト]からデータラベルの変数を設定します。
「オプション」タブ
- 傾向スコアをロジット変換する
- ロジット変換した傾向スコアを使用してマッチングを行う場合、このチェックボックスをオンにします。初期設定はオンです。
- コモンサポートでマッチングする
- コモンサポート外のサンプルを除いてマッチングを実行する場合、このチェックボックスをオンにします。初期設定はオンです。
- キャリパーを指定する
- マッチングが行われるサンプル間にキャリパーを設定する場合、このチェックボックスをオンにします。初期設定はオンです。キャリパーは、標準偏差の定数倍または絶対値を指定します。
- 標準偏差
- 傾向スコアの全体の標準偏差を基準として、マッチングの許容範囲(キャリパー)を指定する場合に選択します。
- 絶対値
- 傾向スコアの差そのもの(絶対値)でマッチングの許容範囲(キャリパー)を指定する場合に選択します。
- 値
- 「標準偏差」を選択した場合は標準偏差に乗じる係数を、「絶対値」を選択した場合は傾向スコアの差の上限値そのものをこのテキストボックスに指定します。
- マッチングバランスを出力する
- マッチング前後で、割り付け群間における傾向スコアや共変量の差を出力する場合、このチェックボックスをオンにします。初期設定はオンです。
- マッチング後のデータに対応のない検定を使用する
- マッチング後のデータを対応のないデータと見なして、検定を計算する場合はこのチェックボックスをオンにします。初期設定はオフです。
- カーネル密度を出力する
- マッチング前後で、割り付けの群間における傾向スコアや共変量のカーネル密度を出力する場合、このチェックボックスをオンにします。初期設定はオンです。
- マッチしたペアを出力する
- マッチングが成立したペアを出力する場合、このチェックボックスをオンにします。初期設定はオンです。
- マッチングの順番 必須
- マッチングを行う際、割り付け変数の値が「1」の群をマッチングする際の順番を選択します。
出力内容
ケースの要約 | 有効ケースと、不明な変数が存在するデータの「サンプルサイズ」と「割合」 |
---|---|
割り付けの要約 | 割り付け変数の値が「0」と「1」のサンプルサイズと、コモンサポート内で割り付け変数の値が「0」と「1」のサンプルサイズ |
基本統計量 | 傾向スコア、共変量、目的変数の「サンプルサイズ」、「平均」、「分散」、「標準偏差」、「最大値」、「最小値」 |
マッチング設定 | ダイアログで設定した「ロジット変換」、「コモンサポート」、「キャリパー」、「マッチングの順番」 |
割り付け変数で層別した基本統計量 | マッチング前のデータを割り付け変数の値が「0」と「1」で層別した傾向スコア、共変量、目的変数の「サンプルサイズ」、「平均」、「分散」、「標準偏差」、「最大値」、「最小値」 |
目的変数の差の平均値※1 | マッチングが成立したペアにおける目的変数の差の平均値 |
マッチングバランス※2 | 元データ、コモンサポート内データ、マッチング後データにおける共変量の「差の平均値」、「標準化した差の平均値」、「バイアスの減少率」、「分散比」 |
検定結果※2 | マッチング前のデータにおける共変量の「ウェルチのt検定」と「ブルンナー=ムンツェル検定」の結果。マッチング後のデータにおける「対応のあるt検定」と「ウィルコクソンの符号つき順位検定」の結果、または「ウェルチのt検定」と「ブルンナー=ムンツェル検定」の結果。 |
標準化した平均値の差※2 | 表側を目的変数の観測値、表頭を目的変数の「予測値」としたクロス集計表。目的変数の0/1と全体についての「判別的中率」も出力されます。 |
マッチしたペア | 元データ、コモンサポート内データ、マッチング後データにおける共変量の標準化した差の平均値のグラフ |
マッチング前後での分布の変化※2 | 元データとマッチング後データにおける傾向スコア、共変量のカーネル密度曲線 |
※1:目的変数を指定した場合に出力します。
※2:ダイアログで[マッチングバランスを出力する]にチェックを入れた場合に出力します。