正規確率プロットと正規性の検定・度数分布とヒストグラム─エクセル統計による解析事例
2017/04/19
カテゴリ:解析事例
タグ:
※ このコンテンツは「エクセル統計(BellCurve for Excel)」を用いた解析事例です。
分析データ
下図は、女子大生123人の身長を測定した結果(架空のデータ)です。ここでは、エクセル統計を用いて正規確率プロットの作成、正規性の検定、ヒストグラムの作成、適合度の検定を行うことでデータの正規性を調べます。
![女子大生の身長 女子大生の身長](../wp-body/wp-content/uploads/2017/04/ex_16_1.png)
正規確率プロットと正規性の検定
まず、正規性の検定の有意水準を「0.05」に設定します。
続いて、セル「C3」を選択後、メニューより[エクセル統計]→[基本統計・相関]→[正規確率プロットと正規性の検定]を選択します。
![データ範囲の先頭行を選択 データ範囲の先頭行を選択](../wp-body/wp-content/uploads/2017/04/ex_16_2.png)
ダイアログが表示される際、セル範囲「C3:C126」が[データ入力範囲]に自動で指定されます。このまま[OK]を選択して分析を実行します。
![[正規確率プロットと正規性の検定]ダイアログ [正規確率プロットと正規性の検定]ダイアログ](../wp-body/wp-content/uploads/2017/04/ex_16_3.png)
基本統計量
サンプルサイズ、平均、不偏分散、標準偏差、最小値、最大値、歪度、尖度が出力されます。データが正規分布している場合、歪度は0、尖度は3となりますが、尖度が4.6339なので正規分布よりも尖った分布となっています。
![基本統計量 基本統計量](../wp-body/wp-content/uploads/2017/04/ex_16_4.png)
正規確率プロット(データ)
観測値による正規Q-Qプロットのためのデータ、観測値を標準化した値による正規Q-Qプロットのためのデータ、正規P-Pプロットのためのデータが出力されます。
![正規確率プロット(データ) 正規確率プロット(データ)](../wp-body/wp-content/uploads/2017/04/ex_16_5.png)
正規確率プロット(グラフ)
正規Q-Qプロット、正規Q-Qプロット[標準化]、正規P-Pプロットが出力されます。正規確率プロットは、プロットが直線状に分布していればデータが正規分布していることを表します。
![正規Q-Qプロット 正規Q-Qプロット](../wp-body/wp-content/uploads/2017/04/ex_16_6.png)
![正規Q-Qプロット [標準化] 正規Q-Qプロット [標準化]](../wp-body/wp-content/uploads/2017/04/ex_16_7.png)
![正規P-Pプロット 正規P-Pプロット](../wp-body/wp-content/uploads/2017/04/ex_16_8.png)
正規性の検定
正規性の検定として、歪度によるダゴスティーノ検定、尖度によるダゴスティーノ検定、歪度と尖度によるオムニバス検定、コルモゴロフ=スミルノフ検定、シャピロ=ウィルク検定の結果が出力されます。
歪度によるダゴスティーノ検定の両側P値は0.5772なので帰無仮説は棄却されませんでした。尖度によるダゴスティーノ検定の両側P値は0.05未満なので帰無仮説は棄却されました。歪度は正規分布に近いですが、尖度は正規分布と離れていることを裏付けています。
帰無仮説:歪度 = 0
![歪度による検定 歪度による検定](../wp-body/wp-content/uploads/2017/04/ex_16_9.png)
帰無仮説:尖度 = 3
![尖度による検定 尖度による検定](../wp-body/wp-content/uploads/2017/04/ex_16_10.png)
帰無仮説:母集団分布は正規分布である
![歪度と尖度による検定 歪度と尖度による検定](../wp-body/wp-content/uploads/2017/04/ex_16_11.png)
帰無仮説:母集団分布は正規分布である
![コルモゴロフ=スミルノフ検定 コルモゴロフ=スミルノフ検定](../wp-body/wp-content/uploads/2017/04/ex_16_12.png)
帰無仮説:母集団分布は正規分布である
![シャピロ=ウィルク検定 シャピロ=ウィルク検定](../wp-body/wp-content/uploads/2017/04/ex_16_13.png)
度数分布とヒストグラム
データの正規性を調べる場合、度数分布表から正規分布との適合度を検定したり、ヒストグラムを作成して分布の形状を確認したりする方法もあります。
先ほどと同様、セル「C3」を選択後、メニューより[エクセル統計]→[基本統計・相関]→[度数分布とヒストグラム]を選択します。
![[度数分布とヒストグラム]ダイアログ[データ]タブ [度数分布とヒストグラム]ダイアログ[データ]タブ](../wp-body/wp-content/uploads/2017/04/ex_16_14.png)
[階級設定]タブの[等間隔]オプションを選択し、[最小]と[間隔]を指定します。
![[度数分布とヒストグラム]ダイアログ[階級設定]タブ [度数分布とヒストグラム]ダイアログ[階級設定]タブ](../wp-body/wp-content/uploads/2017/04/ex_16_15.png)
[検定]タブでチェックボックス[適合度の検定(カイ二乗検定)を行う]にチェックを入れ、[OK]ボタンをクリックします。
![[度数分布とヒストグラム]ダイアログ[検定]タブ [度数分布とヒストグラム]ダイアログ[検定]タブ](../wp-body/wp-content/uploads/2017/04/ex_16_16.png)
基本統計量
サンプルサイズ、平均、不偏分散、標準偏差、最小値、最大値、変動係数が出力されます。
![基本統計量 基本統計量](../wp-body/wp-content/uploads/2017/04/ex_16_17.png)
度数分布表
階級下限値、実測度数、(正規分布による)期待度数、相対度数、累積相対度数が出力されます。
![度数分布表 度数分布表](../wp-body/wp-content/uploads/2017/04/ex_16_18.png)
適合度の検定
実測度数分布と期待度数分布について適合度の検定を行った結果が出力されます。P値が0.05未満なので、帰無仮説「母集団分布は正規分布である」は棄却されました。
![適合度の検定 適合度の検定](../wp-body/wp-content/uploads/2017/04/ex_16_19.png)
ヒストグラム
実測度数分布を元にヒストグラムが出力されます。
![ヒストグラム(実測度数) ヒストグラム(実測度数)](../wp-body/wp-content/uploads/2017/04/ex_16_20.png)
エクセル統計では出力されませんが、期待度数分布についてヒストグラムを作成すると下図のようになります。実測度数のヒストグラムよりもなだらかな山になっていることが確認できます。
![ヒストグラム(期待度数) ヒストグラム(期待度数)](../wp-body/wp-content/uploads/2017/04/ex_16_21.png)
考察
正規性の検定や適合度の検定の結果、ヒストグラムの形状から、今回のデータは正規分布していないと言えそうです。
※ 掲載している画像は、エクセル統計による出力後に一部書式設定を行ったものです。
ダウンロード
この解析事例のExcel ファイルのダウンロードはこちらから → example_16.xlsx
このファイルは、エクセル統計の体験版に対応しています。