BellCurve 統計WEB

  • Step1. 初級編
  • 4. 箱ひげ図と幹葉表示

4-3. 外れ値検出のある箱ひげ図

箱ひげ図にはいくつかのタイプがあり、4‐2章で紹介した「ひげの上端と下端が最大値や最小値の箱ひげ図」とは異なるものもあります。よく用いられるものとして、ひげの長さを四分位範囲(IQR)の1.5倍を上下限とするものがあります。このとき、「第一四分位数-1.5×IQR」がひげの下限、「第三四分位数+1.5×IQR」がひげの上限となり、ひげの下端より小さい値やひげの上端より大きい値を「外れ値」として扱います。

外れ値とは、データの分布において、他の観測値から大きく外れた値のことです。外れ値は、測定ミスによる場合や実際に何か異常があって観測された場合など、様々な原因によって起こりえます。外れ値が存在すると、データの解釈が難しくなる場合があり、扱いには注意が必要です。

次の図は同じデータから作成した、外れ値のない箱ひげ図(左)と、外れ値のある箱ひげ図(右)です。この箱ひげ図では、外れ値が「×」印で表されています。





4. 箱ひげ図と幹葉表示

事前に読むと理解が深まる- 学習内容が難しかった方に -

大人のための統計教室 和(なごみ) 統計学やデータ分析学ぶなら、大人のための統計教室 和(なごみ)