確率変数

ある現象がいろいろな値を取り得るとき、取り得る値全体を確率変数Xとして表す。どのような値をとるかは決まっていないが、取りうる値、もしくは取りうる値の範囲とその値をとる確率または確率密度が決まっている数のこと。一般に離散型と連続型の二つが用いられる。

<離散型の例>例えば、一つのさいころを振り、出てくる目の値について考える。この時、確率変数はX=1,2,3,4,5,6となり、すべてのXについてP(X)=1/6となる。偶数の目が出る場合については、P(X=2,4,6)=1/2と表される。

確率分布

確率変数の値に対して、その確率変数をとる確率の分布を表現するもの。代表的な確率分布に以下のようなものがある。

離散型確率分布:確率変数が離散的である場合

  • ポアソン分布
  • 二項分布
  • 幾何分布
  • 一様分布

連続型確率分布:確率変数が連続的である場合

  • 一様分布
  • 正規分布
  • 指数分布

角変換

比率pに対して以下の式の値を求めることを角変換と言う。角変換により、比率pの分布を正規分布に近付け、分散を安定化することができる。

 x \longmapsto \sin^{-1} \sqrt{p}

LaTex ソースコード

LaTexをハイライトする

拡張マンテル検定

表頭に反応の有無、表側に傾向のある水準を配置したk行×2列のクロス集計が多層ある場合に、層別要因の影響を調整した上で全体としての傾向-反応関係のカイ二乗検定を行うこと。

階層型クラスター分析 / 階層的クラスター分析

個体(枝)からクラスター(幹)へ階層構造で分類していく分析方法のこと。階層型クラスター分析の結果は樹形図(デンドログラム)によって表される。

凝集的方法では、個体間の類似度行列(距離行列を用いることが多い)からスタートし類似度の高いもの同士を順に合併していく。合併後の類似度の計算方法により合併過程が異なる。エクセル統計の凝集法は、最短距離法、最長距離法、メディアン法、重心法、群平均法、ウォード法をまとめたものとなっている。

カイ二乗分布

正規分布に従ういくつかの変数があるとき、それらの二乗和が従う分布のこと。自由度mのカイ二乗分布は以下の式で表される。\Gamma( )はガンマ関数。

 f(m,x) = \frac{1}{2^{m/2}\displaystyle \Gamma \left(\frac{m}{2}\right)} x^{m/2-1}e^{-x/2} \hspace{20px} (0 \leq x < \infty)

LaTex ソースコード

LaTexをハイライトする

カイ二乗検定

統計的仮説検定のうち、カイ二乗分布を用いる検定の総称。ただし、一般的にはクロス集計表における行要素と列要素が独立かどうかを評価する検定(独立性の検定)を指すことが多い。

km列のクロス集計表のij列の観測度数をO_{ij}、期待度数をE_{ij}i行の合計をn_{i\cdot}j列の合計をn_{\cdot j}、全データの合計をnとおくと、カイ二乗値\chi_0^2は下式から求められる。

 \chi_0^2 = \displaystyle \sum_{i = 1}^k {\displaystyle \sum_{j = 1}^m} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}

LaTex ソースコード

LaTexをハイライトする

ただし、期待度数は下式から求める。

 E_{ij} = \frac{n_{i\cdot}n_{\cdot j}}{n}

LaTex ソースコード

LaTexをハイライトする

km列のクロス集計表の場合、このカイ二乗値は自由度(k-1)\times (m-1)のカイ二乗分布に従うことを利用して検定を行う。

回帰方程式

回帰分析において目的変数の理論値を表した方程式。

回帰分析

分析対象の変数(目的変数 / 従属変数)を他の1つまたは複数の変数(説明変数 / 独立変数)により説明し予測しようとする手法。