重心法

クラスター分析で使用される、クラスター間の距離算出方法の一つ。各クラスターの重心間の非類似度からクラスターを形成する方法。

クラスター(u)(v)を統合して新しいクラスター(w)をつくるとき、クラスター(w)と別の任意のクラスター(t)との間の非類似度D_{wt}を、統合する前のクラスター(u)(v)(t)との非類似度D_{ut}D_{vt}を用いて表すと以下のようになる(n_un_vはクラスター(u)(v)に含まれるデータ数)。

 D_{wt} = \displaystyle\frac{n_u}{n_u + n_v}D_{ut} +\displaystyle \frac{n_v}{n_u + n_v}D_{vt} -  \displaystyle\frac{n_un_v}{(n_u + n_v)^2}D_{uv}

LaTex ソースコード

LaTexをハイライトする

重心

判別分析などにおける、各群の判別関数の値の平均値。判別分析では、各ケースの判別関数の値と重心までの距離を比べ、近い方の重心の群に判別する際に用いられる。

自由回答

調査やアンケートにおいて、質問に対する回答を文章や単語、数値などで自由に回答する形式のこと。FAやOAとも言う。

重回帰分析

ある変数(目的変数)と他の複数の変数(説明変数)との関係を直線の式で表し、その関係を分析する方法。多変量解析の中で最もポピュラーな分析手法。

p個の変数がある場合、重回帰式は以下の式で表される(b_0は定数項、b_1,b_2,\cdots,b_pは偏回帰係数、xは説明変数、yは目的変数を表す)。

 y = b_0 + b_1x_1 + b_2x_2 + \cdots + b_px_p

LaTex ソースコード

LaTexをハイライトする

尺度

得られた変数やデータを分類するときの基準のことで、名義尺度、順序尺度、間隔尺度、比尺度の4つの尺度水準に分けられる。

四分位数

データを小さい方から並び替え、データの個数(サンプルサイズ)で4等分した時の区切り点を四分位数と言う。それぞれ25パーセンタイル(第一四分位数)、50パーセンタイル(中央値)、75パーセンタイル(第三四分位数)とよばれる。