- Step1. 基礎編
- 29. 一元配置分散分析
29-1. 分散分析とは
2標本の平均値に差があるかを検定する方法として、24-3章でt検定について勉強しました。ここでは、3群以上からなるデータ(例えば1組、2組、3組の算数のテスト等)や1つのデータに2つの要素を含むデータ(薬A、B、Cをそれぞれ10mg、20mg投与した場合の効果等)の母平均の差を検定する「分散分析」について説明します。分散分析はデータの「分散」をもとにした分析方法です。
分散分析は群ごとのデータのばらつきを元に、F分布を用いて検定を行います。分散分析を行うにあたっては、次に示すような「分散分析表」を作成します。帰無仮説は「各群の母平均は等しい」となります。分散分析表については29-3章と29-4章で詳しく説明します。
因 子 | 平方和 | 自由度 | 平均平方 | F 値 |
---|---|---|---|---|
要因 | 1108.25 | 6 | 184.71 | 0.926 |
残差 | 7976.86 | 40 | 199.42 | - |
全体 | 9085.11 | 46 | - | - |
■分散分析で使う用語
・要因:データの値に変化を与える要素のことです。算数のテストの場合、「組」以外に「その日の体調」や「気温」、「テスト時間」など様々なものが含まれます。
・因子:要因の中でも特に、母平均に差をもたらすと考えられることから研究対象となる(あるいは注目する)要因を指します。
・水準:1つの要因に含まれる項目(グループ)のことです。算数のテストの場合「組」の水準は「1組、2組、3組」の3つであり、水準数は「3」となります。
・◯元配置:データに含まれる因子の数を表すものです。例えば1組、2組、3組の算数のテストのデータの場合、含まれる因子の数は「組」のみであることから「一元配置のデータ」となります。
■分散分析の種類
分散分析にはいくつかの種類があります。
・「一元配置分散分析」:1つの因子からなるデータを分析する方法で、因子に含まれる水準間の平均値の差を見ることができます。例えば、ある学校の1組、2組、3組の算数のテストのデータがある場合、一元配置分散分析を用いて、1組、2組、3組の算数のテストの平均点に差があるかどうかを検定できます。
・「二元配置分散分析」:2つの因子からなるデータを分析する方法で、各因子における水準間の平均値の差を見ることができます。また、2つの要因が組み合わさることで現れる相乗効果の有無の確認もできます。例えば、薬A、B、Cをそれぞれ10mg、20mg投与した場合の効果についてのデータがある場合、二元配置分散分析を用いて薬の種類によって得られる平均値に差があるか、あるいは薬の投与量によって得られる平均値に差があるかどうかを検定できます。
・「多元配置分散分析」:3つ以上の因子からなるデータを分析する方法です。
■おすすめ書籍
分散分析とはどういうことをしている手法なのか、どういう計算をしているのか、何が分かるのかを丁寧に丁寧に説明している本です。分散分析について勉強する方がまずはじめに手にとってみるべき本です。
29. 一元配置分散分析
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 6. 分散と標準偏差
6-1. 分散
- 28. 等分散性の検定とWelchのt検定
28-1. F分布
- 28. 等分散性の検定とWelchのt検定
28-2. F分布表
- ブログ
エクセル統計の分散分析について