BellCurve 統計WEB

  • Step1. 初級編
  • 22. 母分散の区間推定

22-3. 母分散の信頼区間の求め方1

20-3章で学んだ母平均21-1章で学んだ母比率の推定と同じように、母分散についても区間推定を行うことができます。母分散の区間推定では正規分布t分布ではなく、カイ二乗分布を使います。

母集団が母分散\sigma^{2}の正規分布に従う時、抽出された標本のサンプルサイズをn、不偏分散s^{2}とすると、次の式で表される\chi^{2}(カイ二乗)が自由度(n-1)のカイ二乗分布に従うことを用いて母分散の信頼区間を計算します。

 \displaystyle \chi^{2}=\frac{(n-1)s^{2}}{\sigma^{2}}

例題:

次の表は、2015年12月末時点の各都道府県内にある映画館のスクリーンの合計数のデータから無作為に10都道府県のデータを抽出したものです。スクリーン数の分布は正規分布に従うものとします。このデータから母分散の95%信頼区間を求めてみます。

No. 都道府県 全スクリーン数
1 兵庫 126
2 大阪 224
3 奈良 34
4 岩手 25
5 千葉 199
6 茨城 89
7 福岡 178
8 山梨 14
9 滋賀 38
10 鳥取 11
平均 93.8

  1. 標本の不偏分散を求める
  2. 抽出した標本の不偏分散を次の式から求めます。

     \displaystyle s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}(x_{i}-\overline{x})^{2}

    n=10を代入すると次のようになります。

         \begin{eqnarray*} \displaystyle s^{2}&=&\frac{1}{10-1} \sum_{i=1}^{10}(x_{i}-\overline{x})^{2}  \\ &=& \frac{1}{9}\left\{(126-93.8)^{2}+(224-93.8)^{2}+\cdots+(11-93.8)^{2} \right\} \\ &=& 6757.3 \end{eqnarray*}

  3. 使用するカイ二乗分布の自由度を決める
  4. サンプルサイズが10であることから自由度が10-1=9のカイ二乗分布を用います。

  5. \displaystyle \frac{(n-1)s^{2}}{\sigma^{2}} の値(偏差平方和を分散で割った値)がカイ二乗分布の95%の面積(=確率)の範囲にあればいい(=両端の2.5%の面積の部分の極端な範囲に入らなければいい)ので、カイ二乗分布表から自由度9における上側2.5%点と下側2.5%点(=上側97.5%点)を調べる
  6. 図1

    ただし、カイ二乗分布は左右対称ではないので、上側2.5%点と下側2.5%点をそれぞれ読み取る必要があります。次の図のように自由度が9における\alphaが0.975の値と0.025の値を読み取ります。

    図2

    α
    \nu 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01
    1 0.00 0.00 0.00 0.02 2.71 3.84 5.02 6.64
    2 0.02 0.05 0.10 0.21 4.61 5.99 7.38 9.21
    3 0.12 0.22 0.35 0.58 6.25 7.82 9.35 11.35
    4 0.30 0.48 0.71 1.06 7.78 9.49 11.14 13.28
    5 0.55 0.83 1.15 1.61 9.24 11.07 12.83 15.09
    6 0.87 1.24 1.64 2.20 10.65 12.59 14.45 16.81
    7 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48
    8 1.65 2.18 2.73 3.49 13.36 15.51 17.54 20.09
    9 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67
    10 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21

    カイ二乗分布において上側2.5%点は「\chi_{0.025}^{2}(9)=19.02」、下側2.5%点は「\chi_{0.975}^{2}(9)=2.70」であることから、\displaystyle \frac{(n-1)s^{2}}{\sigma^{2}}の範囲は次のように書けます。

     \displaystyle 2.70 \leq \frac{(n-1)s^{2}}{\sigma^{2}} \leq 19.02

    図3

  7. 95%信頼区間を求める
  8. 3. の式を書き換えます。

     \displaystyle 2.70 \leq \frac{(n-1)s^{2}}{\sigma^{2}} \leq 19.02

    分母と分子を入れ替えます。これにより、不等号の向きが全て逆向きになります。

     \displaystyle \frac{1}{2.70} \geq \frac{\sigma^{2}}{(n-1)s^{2}} \geq \frac{1}{19.02}

    見やすくするため、不等号の向きを全て逆向きに戻します。

     \displaystyle \frac{1}{19.02} \leq \frac{\sigma^{2}}{(n-1)s^{2}} \leq \frac{1}{2.70}

    全てに(n-1)s^{2}をかけます。(n-1)s^{2}は正の数なので、(n-1)s^{2}をかけても不等号の向きは変わりません。

     \displaystyle \frac{(n-1)s^{2}}{19.02} \leq \sigma^{2} \leq \frac{(n-1)s^{2}}{2.70}

    この式を用いることで、母分散\sigma^{2}の95%信頼区間を求められます。合計スクリーン数のデータに当てはめると、

     \displaystyle \frac{(10-1) \times 6757.3}{19.02} \leq \sigma^{2} \leq \frac{(10-1) \times 6757.3}{2.70}

    となるので、計算すると

     \displaystyle 3298.9 \leq \sigma^{2} \leq 20811.0

    となります。標準偏差\sigmaの場合の信頼区間は√(ルート)をとることで求められます。

     \displaystyle  \sqrt{3298.9} \leq \sqrt{\sigma^{2}} \leq \sqrt{20811.0}
     \displaystyle  57.4 \leq \sigma \leq 144.3

    【まとめ】母分散の信頼区間

    サンプルサイズをn、母分散を\sigma^{2}、標本から得られた不偏分散をs^{2}信頼係数\alpha(=100\alpha%)とすると、次の式から母分散\sigma^{2}の95%信頼区間を求めることができる。ただし、「\chi_{\alpha/2}^{2}(n-1)」は「自由度が(n-1)、信頼係数が(1-\alpha) \times 100%のときのカイ二乗分布表の上側(\alpha/2)%点を、「\chi_{1-\alpha/2}^{2}(n-1)」は下側(\alpha/2)%点示す。

     \displaystyle \frac{(n-1)s^{2}}{\chi_{\alpha/2}^{2}(n-1)} \leq \sigma^{2} \leq \frac{(n-1)s^{2}}{\chi_{1-\alpha/2}^{2}(n-1)}

22. 母分散の区間推定

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。