BellCurve 統計WEB

無料登録してPythonを学ぶ
卒業後の追加講座も永年見放題
  • Step1. 基礎編
  • 28. 等分散性の検定とWelchのt検定

28-3. 母分散の比の信頼区間の求め方


22-3章22-4章ではカイ二乗分布を使って、母分散の信頼区間を求める方法について学びました。この章では、母分散の"比"の信頼区間の求め方について学びます。

28-1章で学んだように、確率変数が正規分布 N(\mu_{1}, \sigma_{1}^{2})N(\mu_{2}, \sigma_{2}^{2}) に従う2つの母集団からそれぞれサンプルサイズが n_1n_2 の標本を抽出したときの不偏分散をそれぞれ s_1^2s_2^2 とします。このとき、次の式から算出される統計量Fが自由度(n_{1}-1, n_{2}-1)のF分布に従うことを利用して母分散の比の信頼区間を算出します。

 \displaystyle F=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}}


例題:

ある工場では、生産している部品AとBを1時間毎に1つ抜き取り、その重さを検査しています。計6個の部品Aの重さから算出した不偏分散は s^2 = 5、計11個の部品Bの重さから算出した不偏分散は s^2 = 2.5 でした。この結果から母分散の比(b/a)の95%信頼区間を求めてみます。

  1. 統計量Fを計算する
  2. 部品AとBの重さの不偏分散をそれぞれ s^2_1s^2_2、母分散をそれぞれ \sigma^2_1\sigma^2_2 とすると、次の式から統計量Fを求められます。

     \displaystyle F=\frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}}
  3. 使用するF分布の自由度を決める
  4. サンプルサイズは、部品Aが6、部品Bが11であることから自由度が(6-1, 11-1)=(5, 10)のF分布を用います。

  5. 統計量Fの値がF分布の95%の面積(=確率)の範囲にあればいい(=両端の2.5%の面積の部分の極端な範囲に入らなければいい)ので、F分布表から自由度(5, 10)における上側2.5%点を調べる
  6. 
    
    

    ※確率変数Xが自由度(k_{1}, k_{2})のF分布に従う時、その逆数である \displaystyle \frac{1}{X} は自由度(k_{2}, k_{1})のF分布に従います。したがって、自由度(k_{1}, k_{2})のF分布における上側100\alpha\%点の値が F_{\alpha}(k_{1}, k_{2}) のとき、自由度(k_{2}, k_{1})のF分布における下側100\alpha\%点の値は \displaystyle F_{1-\alpha}(k_{2}, k_{1}) = \frac{1}{F_{\alpha}(k_{1}, k_{2})} として算出できます。

    
    

    【F分布表 \alpha=0.025

    v2↓ v1→ 1 2 3 4 5 6 7
    1 647.789 799.500 864.163 899.583 921.848 937.111 948.217
    2 38.506 39.000 39.165 39.248 39.298 39.331 39.355
    3 17.443 16.044 15.439 15.101 14.885 14.735 14.624
    4 12.218 10.649 9.979 9.605 9.364 9.197 9.074
    5 10.007 8.434 7.764 7.388 7.146 6.978 6.853
    10 6.937 5.456 4.826 4.468 4.236 4.072 3.950
    15 6.200 4.765 4.153 3.804 3.576 3.415 3.293

    統計数値表から F_{0.025}(5, 10) の値を読み取ると「4.236」となっています。また、反対側の値は「F_{0.025}(10, 5)=6.619」の逆数を取って「F_{0.975}(5, 10)=1/6.619=0.151」となります。したがって、F分布において上側2.5%点は「F_{0.025}(5, 10)=4.236」、下側2.5%点は「F_{0.975}(5, 10)=0.151」であることから、\displaystyle \frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}} の範囲は次のように書けます。

     \displaystyle 0.151 \leq \frac{s_{1}^{2} / \sigma_{1}^{2}}{s_{2}^{2} / \sigma_{2}^{2}} \leq 4.236
  7. 95%信頼区間を求める
  8. 3. の式に s^2_1S^2_2 の値を代入します。

     \displaystyle 0.151 \leq \frac{5 / \sigma^2_1}{2.5 / \sigma^2_2} \leq 4.236
     \displaystyle 0.151 \leq \frac{5}{2.5} \times \frac{\sigma^2_2}{\sigma^2_1} \leq 4.236
     \displaystyle 0.151 \leq 2 \times \frac{\sigma^2_2}{\sigma^2_1} \leq 4.236
     \displaystyle \frac{0.151}{2} \leq \frac{\sigma^2_2}{\sigma^2_1} \leq \frac{4.236}{2}

    となるので、\displaystyle \frac{\sigma^2_2}{\sigma^2_1} の95%信頼区間を計算すると

     \displaystyle 0.076 \leq \frac{\sigma^2_2}{\sigma^2_1} \leq 2.118

    となります。

    【まとめ】母分散の比の信頼区間

    確率変数が正規分布 N(\mu_{1}, \sigma_{1}^{2})N(\mu_{2}, \sigma_{2}^{2}) に従う2つの母集団からそれぞれサンプルサイズが n_1n_2 の標本を抽出したときの不偏分散をそれぞれs_1^2s_2^2とすると、次の式から母分散の比 \displaystyle \frac{\sigma^2_2}{\sigma^2_1}(100(1-\alpha))\% 信頼区間を求めることができる。ただし、「F_{\alpha/2}(n_1-1, n_2-1)」は自由度が (n_1-1, n_2-1) のF分布における上側確率が \displaystyle \frac{\alpha}{2} となる値を、「F_{1-\alpha/2}(n_1-1, n_2-1)」は下側確率が \displaystyle \frac{\alpha}{2} となる値を示す。

     \displaystyle F_{1-\alpha/2}(n_1-1, n_2-1) \times \frac{s^2_2}{s^2_1} \leq \frac{\sigma^2_2}{\sigma^2_1} \leq F_{\alpha/2}(n_1-1, n_2-1)} \times \frac{s^2_2}{s^2_1}

    ただし、この式は次の式と同義である。

     \displaystyle \frac{1}{F_{\alpha/2}(n_2-1, n_1-1)} \times \frac{s^2_2}{s^2_1} \leq \frac{\sigma^2_2}{\sigma^2_1} \leq F_{\alpha/2}(n_1-1, n_2-1)} \times \frac{s^2_2}{s^2_1}

28. 等分散性の検定とWelchのt検定


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)