BellCurve 統計WEB

ブログ

公認会計士 論文式試験の選択問題(統計学)を解く ~その2~

2017/12/05

カテゴリ:

概要

この記事は、平成28年公認会計士論文試験の統計学分野の選択問題(第8問)の問題2を解いたものです。 統計学の時間で一通り勉強すれば、第8問はすべて解けるようになります。

記事一覧

  1. 第8問 問題1

  2. 第8問 問題2(本記事)
  3. 第8問 問題3

目次

問題2

■問1:ア

一元配置分散分析における帰無仮説は「効果はない(a_1=a_2=a_3=a_4=0)」です。 対立仮説は「効果がある(\lnot a_1=a_2=a_3=a_4=0)」です。 これは、「a_1a_2a_3a_4の中に少なくともひとつ0ではないものがある」ことを意味します。

■問2

分散分析における誤差項は、重回帰分析と同じ仮定「平均0で分散が等しく、互いに独立な正規分布に従う」を満たす必要があります。

■問2:イ

誤差項は等分散、つまり分散が一定です。

■問2:ウ

誤差項は正規分布に従います。

■問2:エ

誤差項に相関はありません、つまり独立です。

■問3

因子「休憩時間」の平方和S_Aと誤差の平方和S_Eを計算します。 この際、平方和の分解より「S_A+S_E=353.2」が成立することを考慮すると、S_AS_Eのどちらか一方を計算すればよいことが分かります。今回は、因子「休憩時間」の平方和S_Aを計算します。

一元配置分散分析における因子の平方和は、次の手順で計算できます。

  1. ステップ1:すべての群を併合した平均値を計算する
  2. ステップ2:各群ごとの平均値を計算する
  3. ステップ3:各群ごとの群平均と全体平均を用いて平方和を計算する
  4. ステップ4:各群ごとの平方和の総和を計算する

では、それぞれの手順を具体的に追っていきましょう。

ステップ1

データ全体の算術平均値\bar{x}を計算します。

     \begin{eqnarray*} \begin{split} \displaystyle \bar{x} &= \frac{1}{20} \left( (2+6+8+4+1) \\ &\quad  + (6+11+10+8+6) \\ &\quad + (17+14+12+16+10) \\ &\quad + (7+6+8+11+13) )\\ &= \frac{176}{20} \\  &= 8.8 \end{split} \end{eqnarray*}

ステップ2

各群ごとの算術平均値\bar{x}_i \hspace{2mm}(i=1,2,3,4)を計算します。

 \displaystyle \bar{x}_1 = \frac{1}{5}(2+6+8+4+1)=4.2 \\ \bar{x}_2 = \frac{1}{5}(6+11+10+8+6)=8.2 \\ \bar{x}_3 = \frac{1}{5}(17+14+12+16+10)=13.8 \\ \bar{x}_4 = \frac{1}{5}(7+6+8+11+13)=9

ステップ3

各群ごとに、s_i = n_i (\bar{x_i}-\bar{x})^2を計算します。ここで、n_iは各群のサンプルサイズを表します。今回は全てのiについてn_i=5です。

 \displaystyle s_1 =n_1(\bar{x}_1 - \bar{x})= 5 (4.2- 8.8)^2 = 105.8 \\ s_2 =n_2(\bar{x}_2 - \bar{x})= 5 (8.2- 8.8)^2 = 1.8 \\ s_3 =n_3(\bar{x}_3 - \bar{x})= 5 (13.8- 8.8)^2 = 125 \\ s_4 =n_4(\bar{x}_4 - \bar{x})= 5 (9.0- 8.8)^2 = 0.2

ステップ4

全てのs_iを合計します。これが求めるS_Aになります。

 S_A = \displaystyle \sum_{i=1}^{4} s_i = 105.8 + 1.8 + 125 + 0.2 = 232.8

また、S_Eは次のように計算できます。

 S_E = 353.2 - 232.8 = 120.4

■問4

帰無仮説を検定します。検定には、因子と誤差の平均平方V_AV_Eを使用し、次のように検定統計量F_aを構成します。平均平方は、平方和Sを対応する自由度\phiで割ったものです。

 \displaystyle F_a = \frac{V_A}{V_E} =\frac{\frac{S_A}{\phi_A}}{\frac{S_E}{\phi_E}}

\phiの値を求めましょう。 因子の自由度\phi_Aは、「因子の水準数-1」で計算できます。この問題では水準数は4であるため、\phi_A=4-1=3です。

誤差の自由度\phi_Eですが、自由度も平方和と同様に分解することができ、「\phi_A + \phi_E = \phi_T」の関係が成立します。

\phi_Tは、「全体のサンプルサイズ-1」で計算できます。つまり。\phi_T=20-1=19です。 以上のことから、\phi_E=19-3=16と求められます。

検定統計量F_aは、S_AS_E\phi_A\phi_Tを用いて次のように求められます。

 \displaystyle V_A = \frac{S_A}{\phi_A} = \frac{232.8}{3}= 77.6 \\ V_E = \frac{S_E}{\phi_E} = \frac{120.4}{16}=7.525 \\ F_A = \frac{V_A}{V_E} = \frac{77.6}{7.525} =10.3

F_Aは帰無仮説のもとでF分布に従うため、F検定を行います。 F分布表から、自由度(3,16)の上側5パーセント点の値を参照すればいいのですが、(3,16)の点は表に載っていません。このような場合、二通りの考え方で解くことができます。

  1. ■分布の性質を使用して解く方法
  2. パーセント点を固定した場合、F(m,n)は自由度nが増加すると単調に減少するため、 F(3,15) > F(3,16)> F(3,20)の大小関係が成立します。つまり、F(3,16)F(3,15)より大きくなることはありません。

    これは、仮の棄却域として帰無仮説に対し保守的な値F(3,15)を使用し検定が有意となれば、正しい棄却域F(3,16)を使用しても有意になることを意味します。

    また、検定統計量F_Aは10を超えており、F_A=10.3 > F(3,15) = 3.287 > F(3,16) > 3.098 = F(3,20)であることも考慮すると、有意水準5%のもとでは確実に有意であると考えられます。以上より、有意水準5%で帰無仮説は棄却されます。

  3. ■自由度を補完する方法
  4. 分布表にない自由度でも、補完して近似値を求めることができます。調和補完による計算方法を紹介します。

    2点A,Bについて、この2点をt:(1-t)に内分する点Cを計算します。

     C=tA+(1-t)B

    今回は第2自由度15と20について、A=F(3,15)B=F(3,20)C=(3,16)と定めます。つまり次のような式でF(3,16)を計算します。

     F(3,16)= tF(3,15)+(1-t)F(3,20)

    ここで、tは次の式で計算します。

     \displaystyle t = \frac{\frac{1}{N_C}-\frac{1}{N_B}}{\frac{1}{N_A}-\frac{1}{N_B}}

    今回はN_A,N_B,N_Cに第2自由度を使用します。実際に計算すると次のようになります。

     \displaystyle t= \frac{\frac{1}{16}-\frac{1}{20}}{\frac{1}{15}-\frac{1}{20}}=\frac{3}{4}= 0.75

    tの値が求められたので、F(3,16)を計算しましょう。

         \begin{eqnarray*} F(3,16) &=& 0.75 \times F(3,15) + 0.25 \times F(3,20) \\ &=& 0.75 \times 3.287 + 0.25 \times 3.098\\ &=& 3.23975  \end{eqnarray*}

    補完の結果、F(3,16) = 3.23975と求められました。実際の数値はF(3,16)=3.23887\cdotsであるので、精度よく補完できていることがわかります。 この値を棄却域と定め検定統計量F_Aと比較すればよいのですが、F_A=10.3 >3.23975=F(3,16)となるため、有意となることがわかります。

統計学の時間で勉強しよう

今回の問題は、「統計学の時間」の記事で勉強できます。それぞれの問題について、関連する単元をリストアップしています。