サンプルサイズ

データの個数のことで、通常nで表される。「標本の大きさ」とも言う。「サンプル数」や「標本数」がサンプルサイズの意味で用いられることもあるが、これらは「標本の個数」という意味で使われる場合もあり紛らわしい。

算術平均

n個の各個体の観測値xの合計を全観測数(サンプルサイズ)nで割った値。相加平均とも言う。

 \overline{x} = \displaystyle \frac{x_1 + x_2 + \cdots + x_n}{n}

LaTex ソースコード

LaTexをハイライトする

残差分析

  • 回帰分析における残差分析
  • 残差のもつ何らかの傾向(増加している、減少している等)の有無や、飛び抜けた値の有無を確認し、推定されたモデルの妥当性を検証すること。

  • クロス集計表における残差分析
  • どのセルの残差が有意に大きいかを分析すること。残差の値同士を単純に比較することはできないため、残差を標準化しP値から判断を行う。

残差

  • 回帰分析における残差
  • 回帰分析の際に、推定されたモデルのパラメーターでは説明できない部分。観測値から推定値を引いたものとして算出される。

  • クロス集計表における残差
  • クロス集計表の観測度数と期待度数の差として算出される。

三角グラフ

3つの要素の構成比を正三角形内部へのプロットにより表したグラフ。グラフにプロットされたデータの点から三角形の各辺に向かって垂線を引いたときに、各辺との交点がそれぞれの構成比を表す。

三角グラフ

最尤法

与えられた観測値から、尤度を最大にするような母数や理論値を推定する方法。

尤度関数を最大にするようにして推定された値を最尤推定値、またそのときの統計量の関数を最尤推定量と言う。

最頻値

モード。単峰分布である分布で度数が最も大きい値のこと。

  • ExcelMODE

最長距離法

クラスター分析で使用される、クラスター間の距離算出方法の一つ。2つのクラスター間の最も類似性の低い対の非類似度からクラスターを形成する方法。

クラスター(u)(v)を統合して新しいクラスター(w)をつくるとき、クラスター(w)と別の任意のクラスター(t)との間の非類似度D_{wt}を、統合する前のクラスター(u)(v)(t)との非類似度D_{ut}D_{vt}を用いて表すと以下のようになる。

 D_{wt} = \max \left( D_{ut}, D_{vt} \right)

LaTex ソースコード

LaTexをハイライトする

最短距離法

クラスター分析で使用される、クラスター間の距離算出方法の一つ。2つのクラスター間の最も類似性の高い対の非類似度からクラスターを形成する方法。

クラスター(u)(v)を統合して新しいクラスター(w)をつくるとき、クラスター(w)と別の任意のクラスター(t)との間の非類似度D_{wt}を、統合する前のクラスター(u)(v)(t)との非類似度D_{ut}D_{vt}を用いて表すと以下のようになる。

 D_{wt} = \min \left(D_{ut}, D_{vt} \right)

LaTex ソースコード

LaTexをハイライトする