寄与率

データの全情報の中で、各要素のもつ情報が占める割合のこと。

例えば主成分分析では、各主成分の固有値をその総和で割ったものを寄与率とよぶ。主成分分析における寄与率は各主成分が全体の中でどれだけの変動の割合を占めるかを示し、値が大きいほど相対的に説明力が高い主成分であることを表す。

距離行列

複数の個体について、全ての2つの個体の組み合わせについて距離を計算し、行列の形式に並べたもの。 クラスター分析において、クラスター間の距離を行列の形式に並べたものも距離行列と呼ぶ。

距離関数

ある二点間の距離を定義する関数のこと。計算方法の違いから、ユークリッド距離や標準化ユークリッド距離、マハラノビス距離などいくつかの種類がある。

クラスター分析や多次元尺度法において物体の非類似度として用いられることもある。

行列

m\times n個の数字を縦にm行、横にn列並べたもの。下図の例は2行3列の行列。

 \begin{pmatrix} 5&2&0 \\ 3&1&4 \end{pmatrix}

LaTex ソースコード

LaTexをハイライトする

共分散分析

分散分析において要因間の差を探るとき、量的データを持つ補助的な変数(体重や年齢など)の影響も考慮した分析手法。なお、このとき分析に加えた補助的な変数のことを共変量と言う。分散分析と回帰分析を合わせたような分析手法と考えることができる。

共分散

2変数の関係の強さを表す指標の一つ。ただし、データの単位の影響を受けるので値の大きさで単純に比較できない。

n組のデータ (x_1, y_1), (x_2, y_2), \cdots, (x_n, y_n) があるとき、これらの平均\overline{x}, \overline{y}と2変数の差の積和をサンプルサイズ-1で割った値が共分散s_{xy}で、以下の式で表される(詳しい解説はこちら)。ただし、共分散を各変数の標準偏差で割った値は相関係数となる。

 s_{xy} = \frac{1}{n - 1} \displaystyle \sum_{i = 1}^n  {(x_i - \overline{x})(y_{i} - \overline{y})}

LaTex ソースコード

LaTexをハイライトする

偽陽性率

検査の性能を表す指標の一つ。検査で検出したい信号や疾患を有さないもののうち、検査が誤って陽性と判断したものの割合。FPFと表すこともある。1-(特異度)として計算される。

 \displaystyle \frac{b}{b + d}
疾患 合計
あり なし
検査 陽性 a(真陽性) b(偽陽性) a+b
陰性 c(偽陰性) d(真陰性) c+d
合計 a+c b+d a+b+c+d

LaTex ソースコード

LaTexをハイライトする

級内相関係数

評価者が対象に対する評価を行った際、評価者内もしくは評価者間におけるデータの一致度や安定性(=信頼性)を示すための指標。

評価者内信頼性とは、同一評価者による2回以上の繰り返し評価データの一致度である。また、評価者間信頼性とは、2人以上の異なる評価者によって同じ対象を評価したどきの一致度である。

iv class="underArea">