BellCurve 統計WEB

  • Step1. 基礎編
  • 32. その他

32-2. 正規性の確認

データが正規分布に従うことを仮定する統計手法(母平均の推定など)を使う場合は、次のような方法を用いてデータの正規性を確認する必要があります。

  • ヒストグラムを描く
  • Q-Qプロットを描く
  • 正規性の検定を行う

■ヒストグラムを描く

左のグラフでは平均値を中心に左右対称の山型の分布が見られることから、データは正規分布に従うと考えられます。一方の右のグラフでは分布が左に偏っており、右裾を引くヒストグラムであることから正規分布に従うとは言えません。

■Q-Qプロットを描く

Q-Qプロット(Quantile-Quantile Plot)は、2つの確率分布を比較するための図です。2つの分布が類似している場合には、プロットが一直線に並びます。

データが正規分布しているかを判断するための図を特に正規Q-Qプロットといいます。正規Q-Qプロットの縦軸は「データの値」を、横軸は「データの期待値を標準化した値(正規分布の理論値)」を表します。次の図で示すようにプロットが一直線に並ぶ場合、データは正規分布していると考えることができます。

正規Q-Qプロットは次の手順で作成します。

  1. データを小さい順に並べたものを準備する(x_1, x_2, x_3, \cdots, x_n
  2. 正規分布の累積分布関数を準備する
  3. 1と2のデータからそれぞれ分位数を取得する(k/(データの数)%点の値 {k: 1, 2, 3, \cdots, n}を取得する)
  4. 1のデータから取得した分位数を縦軸に、2のデータから取得した分位数を横軸に取り、3で取得した値をプロットする

次のグラフは、様々なデータから作成した正規Q-Qプロットです。

■正規性の検定を行う

正規性の検定には次に示すようにいろいろな検定方法があります。

  • 歪度によるダゴスティーノ検定
  • 尖度によるダゴスティーノ検定
  • 歪度と尖度によるオムニバス検定
  • コルモゴロフ=スミルノフ検定
  • シャピロ=ウィルク検定

32. その他

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)