BellCurve 統計WEB

  • Step1. 基礎編
  • 30. 二元配置分散分析

30-3. 二元配置分散分析の分散分析表3

二元配置分散分析一元配置分散分析と同じように、「平均平方」の比を用いて検定を行います。平均平方の比は不偏分散の比と同様にF分布を用いて検定できます。

因 子 平方和 自由度 平均平方 F 値
肥料の量 126.64 3 42.21 29.49
土の種類 66.33 1 66.33 46.33
肥料の量×土の種類 17.79 3 5.93 4.14
残差 22.91 16 1.43
全体 233.67 23

■F値について

統計量Fは「各因子の平均平方」を「残差の平均平方」で割って算出します。

肥料の量:42.21/1.43=29.49

土の種類:66.33/1.43=46.33

肥料の量×土の種類:5.93/1.43=4.14

■分散分析におけるF検定について

分散分析では測定誤差などによって生じる誤差(偶然誤差)のバラつき(=残差の平均平方)と比較して、データ全体の平均値から因子の各水準の平均値のズレ(=因子の平均平方)が十分に大きいかどうかを検定します。この検定により有意な結果となった場合、「データ全体の平均値から因子の各水準の平均値のズレが偶然誤差よりも有意に大きい=因子の水準間の平均値には差がある」と結論付けられます。

分散分析表の統計量Fの値を、F分布を使って検定した結果が次の表です。有意水準は5%です。

因 子 使用する
F分布の自由度
F分布表から
読み取ったF値
分散分析から得られた
統計量Fの値
検定結果
肥料の量 (3, 16) 3.239 29.49 帰無仮説を棄却
土の種類 (1, 16) 4.494 46.33 帰無仮説を棄却
肥料の量×土の種類 (3, 16) 3.239 4.14 帰無仮説を棄却

いずれの因子の統計量Fも、有意水準5%ではF分布表から読み取ったF値と比較して大きくなっています。つまり、いずれの因子の統計量FにおいてもF統計分布の棄却域に入っていることから、有意水準5%の片側検定において帰無仮説H_0を棄却し、対立仮説H_1を採択します。言い換えると「肥料の量によって収量の平均値に差がある」および「土の種類によって収量の平均値に差がある」と結論付けられます。ここでは「肥料の量×土の種類」の「交互作用」について考えていません。交互作用を含めた結論については次の30-4章で説明します。



■各水準の母平均の信頼区間

因子AとBの交互作用が有意である場合、Aにおける水準jかつBにおける水準kの母平均の信頼区間は次の式から求められます。

 \displaystyle \overline{x}_{jk}-t_{\alpha/2}(df_E) \times \sqrt{\frac{V_E}{n_{jk}}} \leq \mu  \leq \overline{x}_{jk}+t_{\alpha/2}(df_E) \times \sqrt{\frac{V_E}{n_{jk}}}

\bar{x}_{jk}は水準jkの標本平均を、df_Eは残差の自由度を、V_Eは残差の平均平方を、n_{jk}は水準jkにおけるサンプルサイズを表します。

例えば、29-2章の例題の「肥料 100g」かつ「土A」の作物の収量の母平均の95%信頼区間は

 \displaystyle 14.6-t_{0.025}(16) \times \sqrt{\frac{1.43}{3}} \leq \mu  \leq 14.6+t_{0.025}(16) \times \sqrt{\frac{1.43}{3}}
 \displaystyle 14.6-2.120 \times 0.7 \leq \mu  \leq 14.6+2.120 \times 0.7
 \displaystyle 13.1 \leq \mu  \leq 16.1

と計算できます。


因子AとBの交互作用が有意ではない場合、因子AとBを分けて考えます。Aにおける水準j、Bにおける水準kの母平均の信頼区間はそれぞれ次の式から求められます。

 \displaystyle \overline{x}_{j}-t_{\alpha/2}(df_E) \times \sqrt{\frac{V_E}{n_{j}}} \leq \mu  \leq \overline{x}_{j}+t_{\alpha/2}(df_E) \times \sqrt{\frac{V_E}{n_{j}}}
 \displaystyle \overline{x}_{k}-t_{\alpha/2}(df_E) \times \sqrt{\frac{V_E}{n_{k}}} \leq \mu  \leq \overline{x}_{k}+t_{\alpha/2}(df_E) \times \sqrt{\frac{V_E}{n_{k}}}

\bar{x}_{j}\bar{x}_{k}は各水準jkの標本平均を、df_Eは残差の自由度を、V_Eは残差の平均平方を、n_{j}n_{k}は水準jkにおけるサンプルサイズを表します。

30. 二元配置分散分析

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)