外れ値検定 : Test for Outliers
概要
外れ値検定とは、データから外れ値を除くための手法です。本製品では、スミルノフ=グラブス検定、トンプソンの棄却検定、増山の棄却検定、ディクソンの棄却検定を用いています。この方法では、平均値からのずれを標準偏差で割った値を元に、外れが大きいものから順に外れ値を除いていきます。1回の検定で1つの外れ値を除き、外れ値がなくなるまで検定を繰り返します。
分析例ファイルのダウンロード
外れ値検定を使用する際のデータの形式やダイアログの指定方法、出力結果などを以下のExcelファイルからご確認いただけます。ダウンロードしてご参照ください。この分析例ファイルは、製品をご購入された場合にも自動でインストールされます。
なお、エクセル統計の無料体験版では、分析例ファイルのデータを実際に分析してみることができます。
処理対象データ
「データベース形式」のデータを計算することができます。
- 先頭行を変数のラベルとして扱います。
- 2行目以降を各変数の観測値として計算に用います。
- 列ごとに欠損値を除いて計算を行います。
先頭行のラベルを除いたセル範囲について、行数と列数の上限、扱えるデータの種類は次の通りです。
データサイズ
- 行数3~60,000行
- 列数1~100列
データ内容
- 数値○:処理可
- 文字列欠損値として除く
- 空白欠損値として除く
出力内容
データ | 「データNo.」、「元データ」、「除外済データ(元データから外れ値を除いたデータ)」、「外れ値」 | 有意水準 | ダイアログで設定した有意水準の値が出力されます。 |
---|---|
要約 | 「元データ数」、「除外済データ数」、「外れ値のデータ数」 |
検定過程 | ダイアログで選択した手法に基づく外れ値検定を、外れ値が検出されなくなるまで繰り返した結果が出力されます。「サンプルサイズ」、「平均」、「不偏分散」、「標準偏差」、「外れ値(最小値)」、「外れ値(最大値)」、「外れ値No.」、「P 値※」、「検定結果」、「対立仮説」が出力されます。 |