エクセル統計 搭載機能

母平均の差の検定 : Hypothesis Testing for the Difference in Means

概要

母集団からサンプリングした2標本のサンプルサイズ( \(n_1,\ n_2\) )、平均値( \(x_1,\ x_2\) )、不偏分散( \(s_1^2,\ s_2^2\) )をもとに、2群の母集団の平均値( \(\mu_1,\ \mu_2\) )が等しいという帰無仮説を検定します。「 \(\mu_1 \neq \mu_2\) 」を対立仮説に設定する場合、両側P値より有意性を判定します。「 \(\mu_1 > \mu_2\) 」あるいは「 \(\mu_1 < \mu_2\) 」を対立仮説に設定する場合、片側P値より有意性を判定します。

対応のない2標本のデータがそれぞれ1列ずつにまとめられている場合、「母平均の差の検定(表形式)」を使用してください。2標本のデータが観測値1列と標本を識別する変数1列にまとめられている場合、「母平均の差の検定(データベース形式)」を使用してください。

分析例ファイルのダウンロード

母平均の差の検定を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。

 ex_03_TwoSample.xlsx(189KB)

なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。

 無料体験版ダウンロード

処理対象データ

「表形式」、「要約データ形式」、「データベース形式」のデータを計算することができます。

表形式

表形式のレイアウト例

  • 先頭行を変数のラベルとして扱います。
  • 2行目以降を各変数の観測値として計算に用います。
  • 列ごとに欠損値を除いて計算を行います。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ(表形式)

  • 行数2~60,000行
  • 列数1~255列

データ内容(表形式)

  • 数値○:処理可
  • 文字列欠損値として除く
  • 空白欠損値として除く

要約データ形式

要約データ形式のレイアウト例

  • 先頭行を変数のラベルとして扱います。
  • 2行目以降を「サンプルサイズ」、「平均値」、「標準偏差」として計算に用います。
  • 欠損値がある場合は計算を行いません。
  • 「サンプルサイズ」が0または負の場合は計算を行いません。
  • 「標準偏差」が負の場合は計算を行いません。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ(要約データ形式)

  • 行数3行
  • 列数1~255列

データ内容(要約データ形式)

  • 数値○:処理可
  • 文字列×:処理不可
  • 空白×:処理不可

データベース形式

データベース形式のレイアウト例

  • 先頭行を変数のラベルとして扱います。
  • 2行目以降を各変数の観測値として計算に用います。
  • 「標本を識別する変数」を1列含みます。このデータ例では、「グループ」が「標本を識別する変数」です。
  • 「標本を識別する変数」に含まれるカテゴリーは2種類である必要があります。
  • 「標本を識別する変数」が欠損値となっている行をデータ全体から除いて計算を行います。
  • 「検定を行う変数」を1列以上含みます。このデータ例では、「観測値」が「検定を行う変数」です。複数列指定した場合は同時に検定を行うことができます。
  • 「検定を行う変数」に欠損値が含まれる場合、列ごとに欠損値を除いて計算を行います。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ(標本を識別する変数)

  • 行数2~60,000行
  • 列数1列

データ内容(標本を識別する変数)

  • 数値○:処理可
  • 文字列○:処理可
  • 空白欠損値として除く

データサイズ(検定を行う変数)

  • 行数2~60,000行
  • 列数1~250列

データ内容(検定を行う変数)

  • 数値○:処理可
  • 文字列欠損値として除く
  • 空白欠損値として除く

出力内容

メニュー「母平均の差の検定(表形式)」において標本1と標本2に複数の変数を指定した場合、すべての変数の組み合わせについて検定を行います。

基本統計量 各標本それぞれの「有効サンプルサイズ」、「平均※1※2」、「不偏分散※1※2」、「標準偏差※1※2」、「標準誤差※1※2」、「中央値※3」、「平均順位※4」、「統計量:U※4
等分散性の検定(両側検定)※2 帰無仮説:「2標本の母分散は等しい」をF分布に従う統計量を用いて検定した結果

ダイアログにて[確率分布]を[t分布]とした場合※1

平均の差と効果量 2標本の「平均の差」、「効果量(Cohen's d)」、「効果量(Hedges' g)」が出力されます。効果量はそれぞれ「効果量(観測値)」と「効果量(ランク化)」が出力されます。「効果量(観測値)」は入力されたデータから算出された値、「効果量(ランク化)」は入力されたデータに順位付けしたものから算出された値です。
母平均の差の95%信頼区間 t推定 t分布に基づく2標本の母平均の差の95%信頼区間の「下限値」と「上限値」
母平均の差の95%信頼区間 Welchの方法 Welchの方法による2標本の母平均の差の95%信頼区間の「下限値」と「上限値」
母平均の差の検定 t検定 帰無仮説:「2標本の母平均は等しい」について、t分布に従う統計量を用いて検定した結果が出力されます。「観測値」と「ランク化」されたデータのそれぞれについて結果が出力されます。
母平均の差の検定 Welchの方法 帰無仮説:「2標本の母平均は等しい」について、t分布に従う統計量を用いて検定した結果が出力されます。統計量はWelchの方法により計算され、小数点以下を含む自由度に対応した正確なP値が出力されます。
検出力 母平均の差の検定のそれぞれについての検出力。計算に用いている効果量はHedges' gです。

ダイアログにて[確率分布]を[正規分布]とした場合※1

平均の差と効果量 2標本の「平均の差」、「効果量(Cohen's d)」、「効果量(Hedges' g)」
母平均の差の95%信頼区間 正規分布に基づく2標本の母平均の差の95%信頼区間の「下限値」と「上限値」
母平均の差の検定 帰無仮説:「2標本の母平均は等しい」について、正規分布に従う統計量を用いて検定した結果
検出力 母平均の差の検定の検出力。計算に用いている効果量はHedges’ gです。

ノンパラメトリック検定(メニュー「母平均の差の検定(データベース形式)」を実行した場合のみ)

中央値検定※3 算出された「全体の中央値」を用いて2行×2列の分割表を出力します。分割表から「独立性の検定」、「Yatesの補正」、「Fisherの直接確率(両側P値)」、「Fisherの直接確率(片側P値)」の結果を出力します。
マン=ホイットニーのU検定※4 統計数値表による結果と正規化検定の結果が出力されます。詳細は、「マン=ホイットニーのU検定」を参照してください。
ブルンナー=ムンツェル検定※5 全データに割り当てられた順位と、各標本内での順位からブルンナー=ムンツェル検定を行った結果を出力します。詳細は、「ブルンナー=ムンツェル検定」を参照してください。
2標本コルモゴロフ=スミルノフ検定※6 累積相対度数の「最大差」と「統計量KS」からコルモゴロフ=スミルノフ検定を行なった結果を出力します。詳細は、「2標本コルモゴロフ=スミルノフ検定」を参照してください。

※1:「データベース形式」で[母平均の差の検定]をチェックした場合に出力されます。

※2:「データベース形式」で[等分散性の検定]をチェックした場合に出力されます。

※3:「データベース形式」で[中央値検定]をチェックした場合に出力されます。

※4:「データベース形式」で[マン=ホイットニーのU検定]をチェックした場合に出力されます。

※5:「データベース形式」で[ブルンナー=ムンツェル検定]をチェックした場合に出力されます。

※6:「データベース形式」で[2標本コルモゴロフ=スミルノフ検定]をチェックした場合に出力されます。

エクセル統計を使えば、Excelのデータをそのまま簡単に統計解析できます。


2標本の比較 その他の手法

搭載機能一覧に戻る