判別分析 : Discrimination Analysis
概要
判別分析では、個体が持ついくつかの情報(説明変数)に重みをつけることで、各個体がどの群に属するかを分析します。医療の場面を例にとると、いくつかの臨床検査の結果から病気の種類を判別したい場合などに利用できます。
本製品では、フィッシャーの線形判別関数を拡張した正準判別という手法を採用しています。判別関数式に各変数の値を代入し得られた値を判別得点といいます。判別分析を用いるには、いくつかの個体があらかじめどの群に属しているかという情報が必要とされ、これを目的変数とします。
分析例ファイルのダウンロード
判別分析を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
データベース形式
データサイズ範囲 | 処理対象データ | |||||
---|---|---|---|---|---|---|
行数 | 列数 | 判別群 | 数値 | 文字列 | 空白 | |
目的変数 | 3~60,000行 | 1列 | 2~10群 | ○ | ○ | 欠 |
説明変数 | 3~60,000行 | 1~100列 | - | ○ | 欠 | 欠 |
※:○…処理可、×…処理不可、欠…欠損値として除く
出力内容
ケースの要約 | 有効ケース、目的変数のみ不明、説明変数のみ不明、ともに不明、全体の「サンプルサイズ」と「割合」 |
---|---|
目的変数の要約 | 目的変数の各群の「サンプルサイズ」と「割合」 |
基本統計量 | 目的変数の全体と各群における各説明変数の「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「最小値」、「最大値」 |
相関行列 | 目的変数の全体と各群における説明変数間の相関係数の行列 |
線形結合している変数 | 説明変数間で線形結合している変数のリスト |
変数選択の方法 | 変数選択に用いた方法と変数選択の基準値 |
BoxのM検定(等分散性の検定)※1 | BoxのM検定による各群の分散共分散行列の等分散性の検定の結果 |
モデル※2 | 判別関数式の「(説明)変数の数」、「相関比η2」、「有意性検定の結果」(Wilks' lambda、自由度1、自由度2、P値)、変数選択過程もしくは最終ステップで投入、除去された変数※2 |
判別関数式に含まれる変数※2 | 判別関数式に含まれる各説明変数の有意性の検定の結果 |
判別関数式に含まれない変数※2 | 判別関数式に含まれない各説明変数を判別関数式に投入した場合の有意性を検定した結果 |
固有値表 | 各判別関数の「固有値」、「寄与率」、「累積寄与率」、「相関比η2」 |
判別関数の有意性の検定 | 各判別関数から最後の判別関数までの一連の関数群ごとに有意性を検定した結果 |
判別係数 | 各判別関数式における各説明変数の判別係数および定数項の値 |
標準化判別係数 | 各説明変数の判別係数を標準化した値 |
判別結果 | 表側を目的変数の観測値、表頭を目的変数の「予測値」としたクロス集計表です。各目的変数についての「判別的中率」も出力されます。 |
各群の重心 | 正準判別空間における各群の重心 |
【グラフ】群別散布図※3 | 判別群ごとの判別得点の分布をプロットした散布図 |
判別得点※3 | 各ケースの目的変数の「観測値」と判別関数式から算出された「予測値」、各判別関数式の「判別得点」、「各群の重心から算出したマハラノビスの平方距離」 |
※1:ダイアログで[BoxのM検定を出力する]にチェックを入れた場合に出力します。
※2:ダイアログで[変数選択の過程を出力する]にチェックを入れた場合、ステップごとの値も出力します。ただし、「判別関数式に含まれない変数」は「変数選択過程」にのみ出力されます。
※3:ダイアログで[判別得点を出力する]にチェックを入れた場合に出力します。
参考文献
- 田中 豊, 垂水 共之, 脇本 和昌, "パソコン統計解析ハンドブック 2 多変量解析編", 共立出版, 1984.
- 柳井 晴夫, 高木 広文, "多変量解析ハンドブック", 現代数学社, 1986.
- 脇本 和昌, 垂水 共之,田中 豊, "パソコン統計解析ハンドブック 1 基礎統計編", 共立出版, 1984.