統計用語集
クラスター分析
cluster analysis
クラスター分析には複数の手法があり、大きくは階層型と非階層型の2種類に分かれる。
階層型では、得られた標本において、距離や相関係数によってケース間の類似度を求め、類似度の近いものから順にクラスターに結合していく。最初はケースの数だけクラスターがあるが、結合するたびにクラスターの数は1つずつ減っていく。この結合の過程をグラフにしたものがデンドログラムである。
階層的のクラスター間の距離計算の方法には以下のようなものがある。
- 最短距離法
- 最長距離法
- 群平均法
- 重心法
- メディアン法
- ウォード法
非階層型ではクラスター内ではできるだけ均一に、クラスター間はできるだけ異なるように分類する。非階層型クラスター分析の代表的手法の1つにk-means法がある。
- Excel:このマークは、Excel に用意された関数により計算できることを示しています。
- エクセル統計:このマークは、エクセル統計2012以降に解析手法が搭載されていることを示しています。括弧()内の数字は搭載した年を示しています。
- 秀吉:このマークは、秀吉Dplusに解析手法が搭載されていることを示しています。
- ※「エクセル統計」、「秀吉Dplus」は株式会社会社情報サービスのソフトウェア製品です。