BellCurve 統計WEB

  • Step1. 初級編
  • 6. 分散と標準偏差

6-2. 標準偏差

分散は「データがどの程度平均値の周りにばらついているか」を表す指標です。ただし、注意しなければならないのは「分散同士は比べることはできるが、分散と平均を足し算したり、分散と平均を比較したりすることはできない」という点です。これは、分散を計算する際に各データを2乗したものを用いていることが原因です。

例えば100人の身長を「cm」の単位で測定した場合には、平均の単位は「cm」となりますが、分散の単位はその2乗の「cm2」となるため、平均と分散の値をそのまま比較したり計算したりすることはできません。

標準偏差1

そこで、分散の「平方根」を計算することで2乗された単位は元に戻り、足したり引いたりすることができるようになります。分散の正の平方根のことを「標準偏差」と言います。

 \sigma = \sqrt{\displaystyle \frac{1}{n} \displaystyle  \sum_{i = 1}^n {(x_i - \bar{x})^2}}

英語では、standard deviationと表記され、SDと略されることもあります。記号は「\sigma(小文字のシグマ)」を用いて表されることが多く、分散の正の平方根であることから分散を「\sigma^2」と表すこともあります。標準偏差は分散と同様に、「データがどの程度ばらついているか」の指標であり、値が大きいほどばらつきが大きいことを示します。

6‐1章のデータAとデータBから標準偏差を求めてみます。

データA平均値からの差(平均値からの差)2
12.56.25
21.52.25
30.50.25
4-0.50.25
5-1.52.25
6-2.56.25
合計=21合計=0合計=17.5
平均=3.5分散=17.5/6≒2.9
標準偏差=√2.9≒1.7
データB平均値からの差(平均値からの差)2
3.500
3.500
3.500
3.500
3.500
3.500
合計=21合計=0合計=0
平均=3.5分散=0/6≒0
標準偏差=√0≒0

この結果から、データAとデータBの標準偏差は次のようになります。

  • データAの標準偏差:\sigma_A=1.7 あるいは SD_A=1.7
  • データBの標準偏差:\sigma_B=0 あるいは SD_B=0

標準偏差は分散と同様にデータAの方が大きいことから、データAの方がデータBよりもばらついていることが分かります。





6. 分散と標準偏差

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。