エクセル統計 搭載機能

マン=ホイットニーのU検定 : Mann-Whitney U Test / Wilcoxon Rank-Sum Test

概要

対応のない2群のデータについて、母集団分布の同一性を検定します。

母集団からサンプリングした対応のない2標本のデータについて、2標本をあわせて値の小さいデータより順位をつけます。同順位の場合は該当する順位の平均値を割り当てます。例えば、1位のデータが1個、2位のデータが2個ある場合、2位のデータには2位と3位の平均から2.5位を割り当てます。次に2標本それぞれのデータの順位和( \(R_1,\ R_2\) )とサンプルサイズ( \(n_1,\ n_2\) )から、統計量( \(U_1,\ U_2\) )を求め、どちらか小さい方を検定統計量 \(U\) とします。両側検定のみ行い、\(U\) が統計数値表の有意水準5%と1%の棄却限界値以下の場合は帰無仮説「2標本の間に差がない」が棄却され、対立仮説「2標本の間に差がある」が支持されます。

2標本のサンプルサイズの合計が20件以下の場合は、近似値による計算ではなく直接計算による正確検定の結果を出力します。

統計数値表はサンプルサイズが50件以内について用意されています。サンプルサイズが50件を超える場合や同順位のデータがある場合は統計数値表は使用できません。そのような場合は正規化検定の結果を援用します。

分析例ファイルのダウンロード

マン=ホイットニーのU検定を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。

 ex_06_Nonparametric.xlsx

なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。

 無料体験版ダウンロード

処理対象データ

「表形式」と「データベース形式」のデータを計算することができます。

表形式

表形式のレイアウト例

  • 先頭行を変数のラベルとして扱います。
  • 2行目以降を各変数の観測値として計算に用います。
  • 列ごとに欠損値を除いて計算を行います。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ(表形式)

  • 行数2~3,000行
  • 列数1~100列

データ内容(表形式)

  • 数値○:処理可
  • 文字列欠損値として除く
  • 空白欠損値として除く

データベース形式

データベース形式のレイアウト例

  • 先頭行を変数のラベルとして扱います。
  • 2行目以降を各変数の観測値として計算に用います。
  • 「標本を識別する変数」を1列含みます。このデータ例では、「グループ」が「標本を識別する変数」です。
  • 「標本を識別する変数」に含まれるカテゴリーは2種類である必要があります。
  • 「標本を識別する変数」が欠損値となっている行をデータ全体から除いて計算を行います。
  • 「検定を行う変数」を1列以上含みます。このデータ例では、「観測値」が「検定を行う変数」です。複数列指定した場合は同時に検定を行うことができます。
  • 「検定を行う変数」に欠損値が含まれる場合、列ごとに欠損値を除いて計算を行います。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ(標本を識別する変数)

  • 行数4~6,000行
  • 列数1列

データ内容(標本を識別する変数)

  • 数値○:処理可
  • 文字列○:処理可
  • 空白欠損値として除く

データサイズ(検定を行う変数)

  • 行数4~6,000行
  • 列数1~250列

データ内容(検定を行う変数)

  • 数値○:処理可
  • 文字列欠損値として除く
  • 空白欠損値として除く

出力内容

標本1と標本2に複数の変数を指定した場合、すべての変数の組み合わせについて検定を行います。

基本統計量 標本1と標本2の「有効サンプルサイズ」、標本1と標本2を合わせたデータから求めた「平均順位」及び統計量Uが出力されます。
マン=ホイットニーのU検定 統計数値表による検定 検定統計量U(U1、U2の小さい方)を用いた両側検定の結果が出力されます。検定統計量Uが統計数値表の棄却限界値以下の場合は「5%有意」もしくは「1%有意」を表示します。それ以外の場合やサンプルサイズが50件を超える場合、同順位がある場合は※印とともに注釈が出力されます。
マン=ホイットニーのU検定 正規化検定 Uの平均「E(U)」と分散「V(U)」、及び連続性の補正がある場合とない場合それぞれにおける正規化検定の「統計量:z」と「両側P値」が出力されます。P値が0.05未満なら"*"、0.01未満なら"**"が出力されます。
正確検定 2 標本のデータ数の合計が20 以下の場合、正規近似を行わない正確検定の結果が出力されます。P 値が0.05 未満なら"*"、0.01 未満なら"**"が出力されます。

参考文献

  • 丹後 俊郎, "新版 医学への統計学", 朝倉書店, 1993.
エクセル統計を使えば、Excelのデータをそのまま簡単に統計解析できます。


2標本の比較 その他の手法



ノンパラメトリック検定 その他の手法

搭載機能一覧に戻る