母平均の差の検定 | 統計解析ソフトエクセル統計

母平均の差の検定： Hypothesis Testing for the Difference in Means

分析例ファイル
処理対象データ
設定項目
出力内容

概要

母集団からサンプリングした2標本のサンプルサイズ（ \(n_1,\ n_2\) ）、平均値（ \(x_1,\ x_2\) ）、不偏分散（ \(s_1^2,\ s_2^2\) ）をもとに、2群の母集団の平均値（ \(\mu_1,\ \mu_2\) ）が等しいという帰無仮説を検定します。「 \(\mu_1 \neq \mu_2\) 」を対立仮説に設定する場合、両側P値より有意性を判定します。「 \(\mu_1 > \mu_2\) 」あるいは「 \(\mu_1 < \mu_2\) 」を対立仮説に設定する場合、片側P値より有意性を判定します。

対応のない2標本のデータがそれぞれ1列ずつにまとめられている場合、「母平均の差の検定（表形式）」を使用してください。2標本のデータが観測値1列と標本を識別する変数1列にまとめられている場合、「母平均の差の検定（データベース形式）」を使用してください。

分析例ファイルのダウンロード

母平均の差の検定を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。

ex_03_TwoSample.xlsx

なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。

無料体験版ダウンロード

処理対象データ

「表形式」、「要約データ形式」、「データベース形式」のデータを計算することができます。

表形式

表形式のレイアウト例

先頭行を変数のラベルとして扱います。
2行目以降を各変数の観測値として計算に用います。
列ごとに欠損値を除いて計算を行います。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ（表形式）

行数2～60,000行
列数1～255列

データ内容（表形式）

数値○：処理可
文字列欠損値として除く
空白欠損値として除く

要約データ形式

要約データ形式のレイアウト例

先頭行を変数のラベルとして扱います。
2行目以降を「サンプルサイズ」、「平均値」、「標準偏差」として計算に用います。
欠損値がある場合は計算を行いません。
「サンプルサイズ」が0または負の場合は計算を行いません。
「標準偏差」が負の場合は計算を行いません。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ（要約データ形式）

行数3行
列数1～255列

データ内容（要約データ形式）

数値○：処理可
文字列×：処理不可
空白×：処理不可

データベース形式

データベース形式のレイアウト例

先頭行を変数のラベルとして扱います。
2行目以降を各変数の観測値として計算に用います。
「標本を識別する変数」を1列含みます。このデータ例では、「グループ」が「標本を識別する変数」です。
「標本を識別する変数」に含まれるカテゴリーは2種類である必要があります。
「標本を識別する変数」が欠損値となっている行をデータ全体から除いて計算を行います。
「検定を行う変数」を1列以上含みます。このデータ例では、「観測値」が「検定を行う変数」です。複数列指定した場合は同時に検定を行うことができます。
「検定を行う変数」に欠損値が含まれる場合、列ごとに欠損値を除いて計算を行います。

先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。

データサイズ（標本を識別する変数）

行数2～60,000行
列数1列

データ内容（標本を識別する変数）

数値○：処理可
文字列○：処理可
空白欠損値として除く

データサイズ（検定を行う変数）

行数2～60,000行
列数1～250列

データ内容（検定を行う変数）

数値○：処理可
文字列欠損値として除く
空白欠損値として除く

設定項目

Excelの［エクセル統計］タブから、［2標本の比較］→［母平均の差の検定（表形式）］もしくは［2標本の比較］→［母平均の差の検定（データベース形式）］を選択すると以下のダイアログが表示されます。

表形式・要約データ形式

「母平均の差の検定（表形式）」ダイアログ

標本 1 の範囲・標本2 の範囲必須: 1 列から255 列までの実データ（量的データ）または要約データの範囲を指定します。
実データの場合、ラベル行を除いて各列に3 個以上のデータが必要です。「空白」や「文字」のデータは計算から除かれます。
要約データの場合、上から変数（列）ごとに、サンプルサイズ、平均、標準偏差の3行にまとめられている必要があります。
先頭行をラベルとして使用: 入力範囲の先頭行が変数ラベルの場合、このチェックボックスをオンにします。初期設定はオンになっています。
データ内容必須: データの内容に合わせて［実データ］と［要約データ］のいずれかを選択します。
確率分布必須: ［t 分布］と［正規分布］のいずれかを選択します。
検定必須: ［両側検定］と［片側検定］のいずれかを選択します。
対立仮説必須: 検定で［片側検定］を選択した場合、対立仮説として［標本1 < 標本2］と［標本1 >　標本2］のいずれかを選択します。
有意水準必須: 母平均の差の検定の有意水準を0.001以上0.2以下で設定します。初期設定は0.05です。

データベース形式　「変数」タブ

「母平均の差の検定（データベース形式）」変数タブ

データ入力範囲必須: データ入力範囲の変更を行う場合、［変更］ボタンを選択します。データ入力のダイアログが表示されるので、データ入力範囲を設定して［変更］ボタンを選択します。なお、データ入力範囲の先頭行は変数名となります。
標本を識別する変数必須: ［変数リスト］から標本を識別する変数を1つ設定します。
検定を行う変数必須: ［変数リスト］から検定を行う変数を設定します。

データベース形式　「パラメトリック検定」タブ

「母平均の差の検定（データベース形式）」パラメトリック検定タブ

母平均の差の検定: 母平均の差の検定を行う場合はオンにします。
確率分布: ［t分布］と［正規分布］のいずれかを選択します。
検定: ［両側検定］と［片側検定］のいずれかを選択します。
対立仮説: 検定で［片側検定］を選択した場合、対立仮説として［標本1 < 標本2］と［標本1 > 標本2］のいずれかを選択します。
有意水準: 等分散性の検定の有意水準を0.001以上0.2以下で設定します。初期設定は0.05です。
等分散性の検定: 等分散性の検定を行う場合はオンにします。
有意水準: 有意水準を0.001以上0.2以下で設定します。初期設定は0.05です。

出力内容

メニュー「母平均の差の検定（表形式）」において標本1と標本2に複数の変数を指定した場合、すべての変数の組み合わせについて検定を行います。

基本統計量	各標本それぞれの「有効サンプルサイズ」、「平均^※1※2」、「不偏分散^※1※2」、「標準偏差^※1※2」、「標準誤差^※1※2」、「中央値^※3」、「平均順位^※4」、「統計量：U^※4」
等分散性の検定（両側検定）※2	帰無仮説：「2標本の母分散は等しい」をF分布に従う統計量を用いて検定した結果

ダイアログにて［確率分布］を［t分布］とした場合^※1

平均の差と効果量	2標本の「平均の差」、「効果量（Cohen's d）」、「効果量（Hedges' g）」が出力されます。効果量はそれぞれ「効果量（観測値）」と「効果量（ランク化）」が出力されます。「効果量（観測値）」は入力されたデータから算出された値、「効果量（ランク化）」は入力されたデータに順位付けしたものから算出された値です。
母平均の差の95%信頼区間 t推定	t分布に基づく2標本の母平均の差の95%信頼区間の「下限値」と「上限値」
母平均の差の95%信頼区間 Welchの方法	Welchの方法による2標本の母平均の差の95%信頼区間の「下限値」と「上限値」
母平均の差の検定 t検定	帰無仮説：「2標本の母平均は等しい」について、t分布に従う統計量を用いて検定した結果が出力されます。「観測値」と「ランク化」されたデータのそれぞれについて結果が出力されます。
母平均の差の検定 Welchの方法	帰無仮説：「2標本の母平均は等しい」について、t分布に従う統計量を用いて検定した結果が出力されます。統計量はWelchの方法により計算され、小数点以下を含む自由度に対応した正確なP値が出力されます。
検出力	母平均の差の検定のそれぞれについての検出力。計算に用いている効果量はHedges' gです。

ダイアログにて［確率分布］を［正規分布］とした場合^※1

平均の差と効果量	2標本の「平均の差」、「効果量（Cohen's d）」、「効果量（Hedges' g）」
母平均の差の95%信頼区間	正規分布に基づく2標本の母平均の差の95%信頼区間の「下限値」と「上限値」
母平均の差の検定	帰無仮説：「2標本の母平均は等しい」について、正規分布に従う統計量を用いて検定した結果
検出力	母平均の差の検定の検出力。計算に用いている効果量はHedges’ gです。

ノンパラメトリック検定（メニュー「母平均の差の検定（データベース形式）」を実行した場合のみ）

中央値検定※3	算出された「全体の中央値」を用いて2行×2列の分割表を出力します。分割表から「独立性の検定」、「Yatesの補正」、「Fisherの直接確率（両側P値）」、「Fisherの直接確率（片側P値）」の結果を出力します。
マン=ホイットニーのU検定※4	統計数値表による結果と正規化検定の結果が出力されます。詳細は、「マン=ホイットニーのU検定」を参照してください。
ブルンナー=ムンツェル検定※5	全データに割り当てられた順位と、各標本内での順位からブルンナー=ムンツェル検定を行った結果を出力します。詳細は、「ブルンナー=ムンツェル検定」を参照してください。
2標本コルモゴロフ=スミルノフ検定※6	累積相対度数の「最大差」と「統計量KS」からコルモゴロフ=スミルノフ検定を行なった結果を出力します。詳細は、「2標本コルモゴロフ=スミルノフ検定」を参照してください。

※1：「データベース形式」で［母平均の差の検定］をチェックした場合に出力されます。

※2：「データベース形式」で［等分散性の検定］をチェックした場合に出力されます。

※3：「データベース形式」で［中央値検定］をチェックした場合に出力されます。

※4：「データベース形式」で［マン=ホイットニーのU検定］をチェックした場合に出力されます。

※5：「データベース形式」で［ブルンナー=ムンツェル検定］をチェックした場合に出力されます。

※6：「データベース形式」で［2標本コルモゴロフ=スミルノフ検定］をチェックした場合に出力されます。

エクセル統計を使えば、Excelのデータをそのまま簡単に統計解析できます。

エクセル統計の購入へ

2標本の比較その他の手法

→ 搭載機能一覧に戻る

エクセル統計搭載機能

母平均の差の検定： Hypothesis Testing for the Difference in Means

概要

分析例ファイルのダウンロード

処理対象データ

表形式

データサイズ（表形式）

データ内容（表形式）

要約データ形式

データサイズ（要約データ形式）

データ内容（要約データ形式）

データベース形式

データサイズ（標本を識別する変数）

データ内容（標本を識別する変数）

データサイズ（検定を行う変数）

データ内容（検定を行う変数）

設定項目

表形式・要約データ形式

データベース形式　「変数」タブ

データベース形式　「パラメトリック検定」タブ

データベース形式　「ノンパラメトリック検定」タブ

出力内容

2標本の比較その他の手法

エクセル統計 搭載機能

母平均の差の検定 ： Hypothesis Testing for the Difference in Means

概要

分析例ファイルのダウンロード

処理対象データ

表形式

データサイズ（表形式）

データ内容（表形式）

要約データ形式

データサイズ（要約データ形式）

データ内容（要約データ形式）

データベース形式

データサイズ（標本を識別する変数）

データ内容（標本を識別する変数）

データサイズ（検定を行う変数）

データ内容（検定を行う変数）

設定項目

表形式・要約データ形式

データベース形式 「変数」タブ

データベース形式 「パラメトリック検定」タブ

データベース形式 「ノンパラメトリック検定」タブ

出力内容

2標本の比較 その他の手法

エクセル統計搭載機能

母平均の差の検定： Hypothesis Testing for the Difference in Means

データベース形式　「変数」タブ

データベース形式　「パラメトリック検定」タブ

データベース形式　「ノンパラメトリック検定」タブ

2標本の比較その他の手法