母平均の差の検定 : Hypothesis Testing for the Difference in Means
概要
母集団からサンプリングした2標本のサンプルサイズ( \(n_1,\ n_2\) )、平均値( \(x_1,\ x_2\) )、不偏分散( \(s_1^2,\ s_2^2\) )をもとに、2群の母集団の平均値( \(\mu_1,\ \mu_2\) )が等しいという帰無仮説を検定します。「 \(\mu_1 \neq \mu_2\) 」を対立仮説に設定する場合、両側P値より有意性を判定します。「 \(\mu_1 > \mu_2\) 」あるいは「 \(\mu_1 < \mu_2\) 」を対立仮説に設定する場合、片側P値より有意性を判定します。
対応のない2標本のデータがそれぞれ1列ずつにまとめられている場合、「母平均の差の検定(表形式)」を使用してください。2標本のデータが観測値1列と標本を識別する変数1列にまとめられている場合、「母平均の差の検定(データベース形式)」を使用してください。
分析例ファイルのダウンロード
母平均の差の検定を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
「表形式」、「要約データ形式」、「データベース形式」のデータを計算することができます。
表形式
- 先頭行を変数のラベルとして扱います。
- 2行目以降を各変数の観測値として計算に用います。
- 列ごとに欠損値を除いて計算を行います。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ(表形式)
- 行数2~60,000行
- 列数1~255列
データ内容(表形式)
- 数値○:処理可
- 文字列欠損値として除く
- 空白欠損値として除く
要約データ形式
- 先頭行を変数のラベルとして扱います。
- 2行目以降を「サンプルサイズ」、「平均値」、「標準偏差」として計算に用います。
- 欠損値がある場合は計算を行いません。
- 「サンプルサイズ」が0または負の場合は計算を行いません。
- 「標準偏差」が負の場合は計算を行いません。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ(要約データ形式)
- 行数3行
- 列数1~255列
データ内容(要約データ形式)
- 数値○:処理可
- 文字列×:処理不可
- 空白×:処理不可
データベース形式
- 先頭行を変数のラベルとして扱います。
- 2行目以降を各変数の観測値として計算に用います。
- 「標本を識別する変数」を1列含みます。このデータ例では、「グループ」が「標本を識別する変数」です。
- 「標本を識別する変数」に含まれるカテゴリーは2種類である必要があります。
- 「標本を識別する変数」が欠損値となっている行をデータ全体から除いて計算を行います。
- 「検定を行う変数」を1列以上含みます。このデータ例では、「観測値」が「検定を行う変数」です。複数列指定した場合は同時に検定を行うことができます。
- 「検定を行う変数」に欠損値が含まれる場合、列ごとに欠損値を除いて計算を行います。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ(標本を識別する変数)
- 行数2~60,000行
- 列数1列
データ内容(標本を識別する変数)
- 数値○:処理可
- 文字列○:処理可
- 空白欠損値として除く
データサイズ(検定を行う変数)
- 行数2~60,000行
- 列数1~250列
データ内容(検定を行う変数)
- 数値○:処理可
- 文字列欠損値として除く
- 空白欠損値として除く
出力内容
メニュー「母平均の差の検定(表形式)」において標本1と標本2に複数の変数を指定した場合、すべての変数の組み合わせについて検定を行います。
基本統計量 | 各標本それぞれの「有効サンプルサイズ」、「平均※1※2」、「不偏分散※1※2」、「標準偏差※1※2」、「標準誤差※1※2」、「中央値※3」、「平均順位※4」、「統計量:U※4」 |
---|---|
等分散性の検定(両側検定)※2 | 帰無仮説:「2標本の母分散は等しい」をF分布に従う統計量を用いて検定した結果 |
ダイアログにて[確率分布]を[t分布]とした場合※1
平均の差と効果量 | 2標本の「平均の差」、「効果量(Cohen's d)」、「効果量(Hedges' g)」が出力されます。効果量はそれぞれ「効果量(観測値)」と「効果量(ランク化)」が出力されます。「効果量(観測値)」は入力されたデータから算出された値、「効果量(ランク化)」は入力されたデータに順位付けしたものから算出された値です。 |
---|---|
母平均の差の95%信頼区間 t推定 | t分布に基づく2標本の母平均の差の95%信頼区間の「下限値」と「上限値」 |
母平均の差の95%信頼区間 Welchの方法 | Welchの方法による2標本の母平均の差の95%信頼区間の「下限値」と「上限値」 |
母平均の差の検定 t検定 | 帰無仮説:「2標本の母平均は等しい」について、t分布に従う統計量を用いて検定した結果が出力されます。「観測値」と「ランク化」されたデータのそれぞれについて結果が出力されます。 |
母平均の差の検定 Welchの方法 | 帰無仮説:「2標本の母平均は等しい」について、t分布に従う統計量を用いて検定した結果が出力されます。統計量はWelchの方法により計算され、小数点以下を含む自由度に対応した正確なP値が出力されます。 |
検出力 | 母平均の差の検定のそれぞれについての検出力。計算に用いている効果量はHedges' gです。 |
ダイアログにて[確率分布]を[正規分布]とした場合※1
平均の差と効果量 | 2標本の「平均の差」、「効果量(Cohen's d)」、「効果量(Hedges' g)」 |
---|---|
母平均の差の95%信頼区間 | 正規分布に基づく2標本の母平均の差の95%信頼区間の「下限値」と「上限値」 |
母平均の差の検定 | 帰無仮説:「2標本の母平均は等しい」について、正規分布に従う統計量を用いて検定した結果 |
検出力 | 母平均の差の検定の検出力。計算に用いている効果量はHedges’ gです。 |
ノンパラメトリック検定(メニュー「母平均の差の検定(データベース形式)」を実行した場合のみ)
中央値検定※3 | 算出された「全体の中央値」を用いて2行×2列の分割表を出力します。分割表から「独立性の検定」、「Yatesの補正」、「Fisherの直接確率(両側P値)」、「Fisherの直接確率(片側P値)」の結果を出力します。 |
---|---|
マン=ホイットニーのU検定※4 | 統計数値表による結果と正規化検定の結果が出力されます。詳細は、「マン=ホイットニーのU検定」を参照してください。 |
ブルンナー=ムンツェル検定※5 | 全データに割り当てられた順位と、各標本内での順位からブルンナー=ムンツェル検定を行った結果を出力します。詳細は、「ブルンナー=ムンツェル検定」を参照してください。 |
2標本コルモゴロフ=スミルノフ検定※6 | 累積相対度数の「最大差」と「統計量KS」からコルモゴロフ=スミルノフ検定を行なった結果を出力します。詳細は、「2標本コルモゴロフ=スミルノフ検定」を参照してください。 |
※1:「データベース形式」で[母平均の差の検定]をチェックした場合に出力されます。
※2:「データベース形式」で[等分散性の検定]をチェックした場合に出力されます。
※3:「データベース形式」で[中央値検定]をチェックした場合に出力されます。
※4:「データベース形式」で[マン=ホイットニーのU検定]をチェックした場合に出力されます。
※5:「データベース形式」で[ブルンナー=ムンツェル検定]をチェックした場合に出力されます。
※6:「データベース形式」で[2標本コルモゴロフ=スミルノフ検定]をチェックした場合に出力されます。