正準相関係数

ある2組の変数群XYにおいて、各変数群を線形結合した変数fgを作成し、fgの相関係数が最大になるように係数を変化させたときのその相関係数の値のこと。

正規分布

最も一般的な確率分布で、ガウス分布や誤差分布とも言われる。\muを平均値、\sigmaを標準偏差とすると、正規分布の確率密度関数(または分布関数)は以下の式で表される。

 f(x) = \displaystyle \frac{1}{\sqrt{2\pi \sigma^2}} \exp \left(-\frac{(x - \mu)^2} {2\sigma^2} \right) \hspace{20px} (-\infty < x < \infty)

LaTex ソースコード

LaTexをハイライトする

  • ExcelNORMDIST, NORMINV, NORMSDIST, NORMSINV

正規Q-Qプロット

観測値が正規分布に従う場合の期待値をY軸にとり、観測値そのものをX軸にとった確率プロット。

観測値を昇順に並べた順位からパーセンタイル(累積確率)を求め、正規分布の確率密度関数の逆関数を用いて期待値を予測する。プロットが一直線上に並べば、観測値は正規分布に従っていると考えられる。

正規Q-Qプロット

正規P-Pプロット

観測値が正規分布に従う場合の累積確率の期待値をY軸にとり、観測値の順位に基づく累積確率をX軸にとった確率プロット。

累積確率の期待値は、正規分布の確率密度関数に観測値と平均値および標準偏差を代入することで求められる。プロットが一直線上に並べば、観測値は正規分布に従っていると考えられる。

正規P-Pプロット

正規性の検定

データの母集団が正規分布に従っているかどうかを調べるための検定。

    帰無仮説H_0:データの母集団は正規分布に従っている

    対立仮説H_1:データの母集団は正規分布に従っていない

この検定には、コルモゴロフ=スミルノフ検定、リリフォース検定、シャピロ=ウィルク検定、適合度の検定などが知られている。

スピアマンの順位相関係数

順位相関係数の一種。各変量を順位に変換してピアソンの積率相関係数を求めたもの。

対になった変数XYn対のデータがあるとき、XYのそれぞれで順位をつける。n対すべてについてi番目のデータX_iY_iの順位の差d_iを求め、次の式から順位相関係数r_sを算出する。

 r_s = 1 - \displaystyle \frac{6\displaystyle \sum_{i = 1}^n {d_i}^2}{n(n^2 - 1)}

2変数のデータの順序が全て一致する場合は+1、逆順にすると全て一致する場合は-1の値をとる。

LaTex ソースコード

LaTexをハイライトする