BellCurve 統計WEB

【BellCurve監修】統計検定2級対策に最適な模擬問題集

Kindleストアで配信中Kindle電子書籍にて

「統計検定2級 模擬問題集1」&「統計検定2級 模擬問題集2」&「統計検定2級 模擬問題集3」を配信中です。

ブログ

ノンパラメトリック検定

2017/08/14

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら


新曜社の統計用語辞典によると、ノンパラメトリック検定とは「統計的仮説検定の中でも、母集団分布に特定の分布を仮定することなく検定を行うものや、母集団分布を仮定するとしても、そのパラメタ(母数)に関してではない仮説を検定するものなどの総称である」とあります。

「母集団分布に特定の分布を仮定する」とは、ほとんどの場合、「母集団分布が正規分布である」という仮定になります。「パラメタ」とは母集団のデータの分布を特定している定数で、正規分布の場合、平均 μ と標準偏差 σ のことです。

最近では、ノンパラメトリック検定ではない検定のことをパラメトリック検定とも呼びますが、パラメトリック検定の代表格である t検定は、平均、標準偏差、個体数 n の3つの値だけで計算することができます。一方、t検定に対応するノンパラメトリック検定、Mann-Whitney の U検定は、データを値の大きさで並べて順位を付け、順位情報だけを使って計算を進めます( Wilcoxson の順位和検定というのもありますが、両者の違いは検定統計量として U を使うか、順位和を使うかという違いだけで、本質的にはまったく同じ検定です)。

t検定と Mann-Whitney の U検定の違いは検出力に現れます。検出力とは有意差の出やすさと読み替えてもよいでしょう。母集団分布が正規分布のとき t検定の検出力を 1 とすると、U検定の検出力は 0.95 とやや劣ります。しかしながら、母集団分布が正規分布でないときは、両者の検出力は同等か U検定の方が高くなります。正規分布が疑われる場合や、正規分布しているかどうか分からない場合は、U検定の方が、有意差が検出されやすくなります。正規分布かどうかを気にしなくともよいので、ノンパラメトリック検定のことを「分布によらない検定( distribution-free test )」とも呼びます。

さて、2つ目の違いは計算のしやすさです。ゴセットによって t 検定が考案されたのは今から100年前のことです。やや遅れてフィッシャーがノンパラメトリック検定の原点である「ならべかえ検定」を考案しています。t検定は100年間使われ続けましたが、U 検定が普及したのは、この20年ぐらいのことです。平均や標準偏差を計算するのに必要なデータの読み取り回数は1回ですが、順位づけするためには、データを何度も読み取らなければいけません。そのため、パソコンが計算を代わりにしてくれるまでは、t検定の独壇場だったといってよいでしょう。

ノンパラメトリックスに興味を持たれた方へ

粕谷英一氏が「生物学を学ぶ人のための統計のはなし」という本を書いておられます。この本は、t検定ではなく U検定から始まるというユニークな本です。私が今までに読んだ中で統計的方法の原理が一番分かりやすく書かれた本です。生物学以外の方へもお薦めします。



エクセル統計に搭載されているノンパラメトリック検定(1)

エクセル統計に搭載されているノンパラメトリック検定(2)

統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]