BellCurve 統計WEB

  • Step1. 初級編
  • 14. いろいろな確率分布2

14-1. 正規分布

■正規分布

正規分布は統計学における検定や推定、モデルの作成など様々な場面で活用される連続型確率分布です。多くの統計的手法において、データが正規分布に従うことを仮定します。正規分布は次の図のように左右対称の形をしており、横軸は確率変数を、縦軸はそのときの確率密度を表します。

図1

正規分布に従う確率変数Xの確率密度関数f(x)は次の式で表されます。

 \displaystyle f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}~~~(-\infty<x<\infty)

この式の「e」に「exp」を使うと次のように表すこともできます。

 \displaystyle f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left(-\frac{(x-\mu)^{2}}{2\sigma^{2}}}\right)~~~(-\infty<x<\infty)

\sigma(シグマ)」とは「\mu(ミュー)」が正規分布のパラメータ(母数)です。確率変数Xの期待値と分散は次のようになります。

 E(X)=\mu
 V(X)=\sigma^{2}

したがって、確率変数Xは「平均\mu、分散\sigma^{2}の正規分布に従う」と言えます。このとき、「X\sim N(\mu,\sigma^{2})」と書きます。

■正規分布のグラフ

例えば、あるクラスの生徒のテストの点数Xが平均60点、標準偏差10点(分散100)の正規分布に従う時、その確率密度関数は次の図のようになります。確率密度は、平均点である60点(横軸が60)の部分が最も高く、平均から左右に離れるにつれて低くなっていることが分かります。

図2

次に、さまざまな正規分布の形を見てみます。前述の例は平均が60点、標準偏差が10点の正規分布を表したものでしたが、平均値\mu60に固定し、標準偏差\sigmaの値を1251020にした場合の正規分布は次の図のようになります。\sigmaが大きいほど分布の山がなだらかになることが分かります。

図3

また、標準偏差を固定し平均値\muを変化させたとき、その大小で正規分布の分布の山がどのように変化するかを表したものが次の図です。このグラフでは標準偏差を\sigma=10に固定し、平均値\muの値を20406080にしています。正規分布の山頂のX軸座標は\muの値と等しくなるので、\muが大きくなるほどグラフは右側へスライドします。

図4

【コラム】Bell curveの由来

正規分布は平均を中心に左右対称で、教会にある「ベル(釣鐘)」のような形をしていることから、「ベルカーブ(bell curve)」ともよばれます。

正規分布の曲線を描く式は、1733年にフランスのド・モアブルが考案しました。1812年にラプラスが式を完成させたので、この式はド・モアブル-ラプラスの定理として知られています。この式によって得られる確率分布に正規分布の名前が付いたのは1875年のことです。正規分布を釣鐘のようだと思う人はそれ以前からいました。Esprit Jouffret は1872年に書いた論文の中で、次の2変数正規分布の姿を"bell surface"と表現しています。確かに釣鐘のように見えます。

図5

■おすすめ書籍

ちょうどこの章(正規分布)までの内容を網羅しています。数学が苦手な方は一度手にとってみることをおすすめします。





14. いろいろな確率分布2

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。