BellCurve 統計WEB

  • Step1. 初級編
  • 19. 母平均の区間推定(母分散既知)

19-2. 母平均の信頼区間の求め方(母分散既知)

2015年12月末時点の各都道府県内にある映画館のスクリーンの合計数区間推定を行ってみます。47都道府県全てのデータを調べるのは面倒なので、無作為に10都道府県のデータを抽出しました。次の表が抽出したデータです。ただし、母分散(47都道府県にある映画館の合計スクリーン数の分散)は\sigma^{2}=5560であることが分かっており、スクリーン数の分布は正規分布に従うものとします。このデータから「母平均の95%信頼区間」を求めてみます。

No. 都道府県 全スクリーン数
1 兵庫 126
2 大阪 224
3 奈良 34
4 岩手 25
5 千葉 199
6 茨城 89
7 福岡 178
8 山梨 14
9 滋賀 38
10 鳥取 11

母平均の信頼区間は次の1~4に従って算出します。

  1. 標本平均 \overline{x} を求める
  2. これは抽出した標本の平均値を求めるだけです。この例題の場合、 \overline{x} =93.8となります。

  3. 標本平均の標準化を行う
  4. 母平均を\mu、母分散を\sigma^{2}、抽出したサンプルサイズをnとすると、次の式から標本平均を標準化できます。

     \displaystyle \frac{\overline{x}-\mu}{\sqrt{\frac{\sigma^{2}}{n}}}

    中心極限定理は、平均\mu、分散\sigma^{2}に従う母集団からサンプルサイズnの標本を抽出する時、その平均値\overline{x}の分布はnが大きくなるにつれて正規分布N(\mu, \sigma^{2}/n)に近づくというものであることは、17‐4章で既に学びました。母平均の信頼区間の算出にはこの中心極限定理を利用します。標本平均を標準化する理由は、標準正規分布を利用するためです。

  5. 2で標準化した値が標準正規分布の95%の面積(=確率)の範囲にあればよい(=両端の2.5%の面積の部分の極端な範囲に入らなければよい)ので、標準正規分布表から上側2.5%点を調べる
  6. 図1

    標準正規分布において、ある値より大きな値をとる確率が2.5%となるとき、このある値のことを「上側2.5%点」といいます。標準正規分布表を見ると上側2.5%点は「1.96」であることから、負の数である「-1.96」以下の値をとる確率も2.5%となります(標準正規分布は平均値であるx=0において左右対称であるため)。したがって、標準化した値の範囲は次のように書けます。この「1.96」という値は今後もよく出てくるので覚えておくと便利です。

     \displaystyle -1.96 \leq \frac{\overline{x}-\mu}{\sqrt{\frac{\sigma^{2}}{n}}}  \leq 1.96
  7. 95%信頼区間を求める
  8. 3の式を\muについて変形します。

     \displaystyle \overline{x}-1.96 \times \sqrt{\frac{\sigma^{2}}{n}} \leq \mu  \leq \overline{x}+1.96 \times \sqrt{\frac{\sigma^{2}}{n}}

    この式を用いることで、母分散がわかっている時の母平均\muの95%信頼区間を求められます。合計スクリーン数のデータに当てはめると、

     \displaystyle 93.8-1.96 \times \sqrt{\frac{5560}{10}} \leq \mu  \leq 93.8+1.96 \times \sqrt{\frac{5560}{10}}

    となるので、計算すると次のようになります。

     \displaystyle 47.6 \leq \mu \leq 140.0

    【まとめ】母平均の信頼区間(母分散既知)

    標本平均を\overline{x}、母集団の平均を\mu、母分散を\sigma^{2}、抽出したサンプルサイズをnとすると、次の式から母平均\muの95%信頼区間を求めることができる。

     \displaystyle \overline{x}-1.96 \times \sqrt{\frac{\sigma^{2}}{n}} \leq \mu  \leq \overline{x}+1.96 \times \sqrt{\frac{\sigma^{2}}{n}}

    また、一般化して信頼係数\alpha(=100\alpha%)の場合には、標準正規分布の上側確率を用いて次のように表すことができる。\displaystyle z_{\frac{1-\alpha}{2}}は標準正規分布表の上側確率が\displaystyle \frac{1-\alpha}{2}となる値(z値)を表す。

     \displaystyle \overline{x}-z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\sigma^{2}}{n}} \leq \mu  \leq \overline{x}+z_{\frac{1-\alpha}{2}} \times \sqrt{\frac{\sigma^{2}}{n}}

    【コラム】パーセント点

    ある確率分布関数において、ある値▲より大きくなる確率が☆%であるとき、この▲のことを「上側☆%点(パーセント点)」といいます。このとき、ある値▲より大きくなる確率のことを「上側確率」といいます。(ある値▲より小さくなる確率のことを「下側確率」といいます)

    図2

    統計数値表は、さまざまな確率分布におけるある値▲とその上側確率(あるいは下側確率)をまとめた表のことです。

19. 母平均の区間推定(母分散既知)

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。