クラスター抽出法

母集団をいくつかのグループに分け、その中から無作為抽出で選ばれたグループに含まれる標本を全て抽出する方法。集落抽出法と呼ばれることもある。

コンジョイント分析

被験者に商品やサービスのスペックを複数呈示して、スペックに対する選好を尋ねる。その結果からスペックを構成する各要素(機能、デザイン、価格など)が選好にどの程度影響しているかを調べる分析のこと。

スペック組み、スペックの呈示と選好度の計測、部分効用(各要素の選好への影響度合い)の推定の3つのステップからなる。各ステップにおいて様々な方法が考案されており、コンジョイント分析専用のソフトウェアも開発されている。Sawtooth社のACAのように、実験から部分効用の推定、部分効用を用いたマインドシェアのシミュレーションまでパッケージ化されたソフトウェアもある。

コレログラム

異なるラグについて自己相関係数もしくは交差相関系数を算出し、横軸にラグ、縦軸に相関係数をとったグラフのこと。

crosscor_g

コレスポンデンス分析

クロス集計表の行要素と列要素の2変数の全てのカテゴリーの中から似かよったカテゴリーをまとめることなどを目的とする。対応分析とも言う。

1960年代にベンゼクリ(Benzecri)によって提案された。数量化3類、双対尺度法、コレスポンデンス分析、最適尺度法、等質性分析はほぼ同じ内容の統計手法である。

コルモゴロフ=スミルノフ検定

2つの標本についてそれぞれの母集団の確率分布が一致しているかどうか、またはある標本の母集団の確率分布が帰無仮説で提示した確率分布と一致しているかどうかを検定すること。KS検定とも言う。

正規性の検定データの累積確率分布と正規分布の累積確率の差の絶対値の最大値を検定統計量Dとし検定を行う。

 D = \max_x |F(x) - F_n(x)|

LaTex ソースコード

LaTexをハイライトする

2標本全体のデータを階級下限値として各標本について度数分布を作成し、累積相対度数を求める。同階級における標本間の累積相対度数を比較し、累積相対度数の差の最大値をDとする。このDと2標本のサンプルサイズ (n_1, n_2) を用いて、下式から統計量KSを求め検定を行う。

 \displaystyle KS = |D| \times  \sqrt{\frac {n_1n_2}{n_1 + n_2}}

LaTex ソースコード

LaTexをハイライトする

固有方程式

\bf An次の正方行列、\lambdaを固有値、\bf xを固有ベクトルとしたとき、\bf{Ax}=\bf{\lambda}\bf{x}という式ができ、変形して(\bf{A}-\lambda \bf{I})\bf{x}=\bf{0}となる。さらに、\bf{x}\neq \bf{0}であるので、|\bf{A}-\lambda\bf{I}|=\bf{0}と言える。この式を固有方程式と言う。\bf{I}は単位行列である。

固有値

n次の正方行列\bf Aにおいて、\bf{Ax}=\lambda\bf{x}を満たす定数\lambda(ラムダ)とn次ベクトル\bf{x}(\neq \bf{0})が存在するとき、\lambdaを行列\bf Aの固有値、\bf{x}を固有ベクトルと言う。固有値はn次の正方行列の場合、重複を含めてn個存在する。

コホート研究 / コーホート研究

異なる特性を持つ複数の患者群(コホート)を時間の流れに沿って観察し、その特性と疾患との関係を調べようとする研究方法のこと。

例えば喫煙群と非喫煙群を一定期間観察し、喫煙と肺癌の関係を調べる場合など。前向きコホート研究と後向きコホート研究とがある。

誤分類率

検査の性能を表す指標の一つ。全観測値(被検者)のうち、検査結果と疾患の有無が一致しなかった割合。下の式から算出される。

 \displaystyle \frac{b + c}{a + b + c + d}
  疾患 合計
あり なし
検査 陽性 a(真陽性) b(偽陽性) a+b
陰性 c(偽陰性) d(真陰性) c+d
合計 a+c b+d a+b+c+d

LaTex ソースコード

LaTexをハイライトする