正規分布の発見─統計学史(4)
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※
今年はガウス(Johann Carl Friedrich Gauss、1777-1855)が『天体運行論』を出版してからちょうど200年になります。多くの統計学の本では、ガウスが正規分布を発見したと書かれています。ガウスが『天体運行論』の中で、天体観測によるデータの誤差はある基本的な法則に従うという理論を確立したからです。ある基本的な法則というのが正規分布であることから、正規分布のことをガウス分布(Gaussian distribution)ともいいます。正規分布の名前はガウスではなく、それより後に、ゴールトンによって付けられました。
今日、正規分布を発見したのは、ガウスよりも前、フランスの数学者、ド・モアブル(Abraham de Moivre, 1667-1754)の功績とされています。1730年代に、ド・モアブルは、二項分布の n を大きくしていくと分布の形が正規曲線で近似できることを発見しました。これを精密化させたのがラプラス変換でも有名なラプラス(Pierre-Simon Laplace、1749-1827)です。正規分布と中心極限定理の歴史はここから始まります。
中心極限定理がどのような条件下に成立するか厳密な証明に取り組んだのは、19世紀のロシアの数学者、チェビシェフ(Pafnuty Lvovich Chebyshev、1821-1894)や彼の弟子のマルコフ(Andrey Andreyevich Markov、1856-1922)です。彼らは証明に至らず、研究はチェビシェフのもう1人の弟子、リアプノフ(Aleksandr Mikhailovich Lyapunov、1857-1918)に引き継がれました。最終的にこの問題に決着をつけたのはフィンランド人のリンデベルグ(Jarl Waldemar Lindeberg)とフランス人のレヴィ(Paul Levy、1886-1973)です。2人は、ほぼ同時期に条件を発見し数学的に証明しました。ド・モアブルの正規分布の発見から200年後のことです。この条件は、リンデベルグ条件という名前で知られています。
「 m の分布 ―標本平均と中心極限定理」の記事の中で、中心極限定理によって母集団がどんな分布であっても標本平均の分布は正規分布になると書きましたが、実はどんな分布でもというのは正しくなく、リンデベルグ条件を満たさず中心極限定理が成立しない分布があります。コーシー分布と言います。コーシー分布には平均も標準偏差も存在しないのです。コーシー分布に従う母集団から標本抽出をすると、極端に大きな値や小さな値が含まれる可能性が高く、標本平均がある値の付近に集中するということがないのです。どのような分布かというと、自由度 1 の t 分布が標準コーシー分布になります。