相関比

2変数のうち一方が量的変数、もう一方が名義尺度である場合に、この2つの変数間の相関の程度を表す統計量。0から1までの値をとり、1に近付くほど相関が強いと言える。

a種類のカテゴリーの中にn_a個の名義尺度変数xがあるとき、変数全体の平均を\overline{x}とすると、相関比\eta(イータ)の2乗は下式で表される。

 \eta^2 = \frac{\displaystyle \sum_{i = 1}^a  {n_i(\overline{x}_{i\cdot} - \overline{x})^2}} {\displaystyle \sum_{i = 1}^{a} \displaystyle \sum_{j = 1}^{n_i} {(x_{ij} - \overline{x})^2}}

LaTex ソースコード

LaTexをハイライトする

尖度

分布が正規分布からどれだけ逸脱しているかを表す統計量で、山の尖り度と裾の広がり度を示す。以下の2通りの定義がある。

  1. 3未満のときは尖りが緩やかで裾が短い。3より大きいときは尖りが急で裾が長い。正規分布では3となる。エクセル統計の「正規確率プロットと正規性の検定」はこの定義を用いている。サンプルサイズをn、各データx_i (i \colon 1, 2, \cdots, n)の平均値をxとすると、尖度は下式から算出される。
  2.  \displaystyle \frac{n\displaystyle \sum_{i = 1}^n (x_i - \overline{x})^4} {\left( \displaystyle \sum_{i = 1}^n (x_i - \overline{x})^2 \right)^2}

    LaTex ソースコード

    LaTexをハイライトする

  3. 0未満のときは尖りが緩やかで裾が短い。0より大きいときは尖りが急で裾が長い。正規分布では0となる。Excel 関数のKURTおよびエクセル統計の「記述統計量」はこの定義を用いている。サンプルサイズをn、各データx_i (i \colon 1, 2, \cdots, n)の平均値をx、標本標準偏差をsとすると、尖度は下式から算出される。
  4.  \displaystyle \frac{n(n+1)}{(n-1)(n-2)(n-3)} \displaystyle \sum_{i = 1}^n  \frac{(x_i - \overline{x})^4}{s^4} - \frac{3(n-1)^2}{(n-2)(n-3)}

    LaTex ソースコード

    LaTexをハイライトする

センサス

全数調査のこと。単にセンサスと言う場合、国勢調査 Population Census を指すことが多い。

説明変数

因果関係における原因、関数における入力、y=f(x)xを説明変数と言う。独立変数とも言う。

正方行列

行数と列数が等しい行列のこと。以下の例は3行3列の正方行列。

 \begin{pmatrix} 5 & 2 & 0 \\ 3 & 1 & 4 \\ 6 & 2 & 7 \end{pmatrix}

LaTex ソースコード

LaTexをハイライトする