BellCurve 統計WEB

  • Step1. 初級編
  • 4. 箱ひげ図と幹葉表示

4-3. 外れ値検出のある箱ひげ図

箱ひげ図にはいくつかのタイプがあり、4‐2章で紹介した「ひげの上端と下端が最大値や最小値の箱ひげ図」とは異なるものもあります。よく用いられるものとして、ひげの長さを四分位範囲(IQR)の1.5倍とするものがあります。このとき、「第一四分位数-1.5×IQR」がひげの下端、「第三四分位数+1.5×IQR」がひげの上端の値となり、ひげの下端より小さい値やひげの上端より大きい値を「外れ値」として扱います。

外れ値とは、データの分布において、他の観測値から大きく外れた値のことです。外れ値は、測定ミスによる場合や実際に何か異常があって観測された場合など、様々な原因によって起こりえます。外れ値が存在すると、データの解釈が難しくなる場合があり、扱いには注意が必要です。

次の図は同じデータから作成した、外れ値のない箱ひげ図(左)と、外れ値のある箱ひげ図(右)です。この箱ひげ図では、外れ値が「×」印で表されています。

外れ値を含む箱ひげ図1

4. 箱ひげ図と幹葉表示

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。