BellCurve 統計WEB

  • Step1. 初級編
  • 4. 箱ひげ図と幹葉表示

4-2. 箱ひげ図の見方

■パーセンタイル

箱ひげ図の見方を説明する前に、「パーセンタイル」について触れます。パーセンタイルは「データを小さい順で並べたとき、ある数値がデータの小さい方から見て何%の位置にあるかを表すもの」です。0パーセンタイルは最小値を、100パーセンタイルは最大値を表します。Nパーセンタイルは、データ全体をN%と100-N%で分割する値です。

例えば、4‐1章の15人分の体重のデータを用いて30パーセンタイルを表すと、次のようになります。

箱ひげ図の見方2

■四分位数

箱ひげ図には最大値、最小値に加えて「四分位数」の情報が含まれています。四分位数はデータを小さい順に並べて、小さいものから順位を付けた時に、

  • 25%(全体の1/4の部分)=25パーセンタイル
  • 50%(全体の2/4=1/2の部分)=50パーセンタイル
  • 75%(全体の3/4の部分)=75パーセンタイル

に該当する値のことです。

箱ひげ図の見方1

これらの3つの値は次のように呼ばれます。

箱ひげ図の見方3

この3つの四分位数で区切ると、データの個数を4等分することができます。また、第三四分位数から第一四分位数を引いたものを四分位範囲(Inter Quarter Range 略してIQR)といいます。

■箱ひげ図へのあてはめ

四分位数の値を箱ひげに当てはめると次のようになります。

箱ひげ図の見方4

【コラム】箱ひげ図とデータの数

四分位数によってデータは次の4つに区分できます。

  • 区間D:ひげの上端(最大値)から箱の上端(第三四分位)まで
  • 区間C:箱の上端(第三四分位)から箱の中央の線(中央値)まで
  • 区間B:箱の中央の線(中央値)から箱の下端(第一四分位)まで
  • 区間A:箱の下端(第一四分位)からひげの下端(最小値)まで

箱ひげ図の見方5

A、B、C、Dの4区間のなかに、それぞれ同じ個数だけデータが入っています。しかし、同じ個数でもその区間の長さが異なることから、データのばらつき具合を知ることができます。

例えば、区間Bと区間Dでは、区間Bの方が区間が短いことからよりデータが集中していることが分かります。また、箱の高さ(区間Bと区間Cを合わせたもの)は全データの半分のデータを表すことから、およそ「57」から「78」の範囲に全体の半分のデータが存在することが読み取れます。

■おすすめ書籍

Excelで見やすくキレイなグラフを書くときに重宝します。とてもわかり易いです。





4. 箱ひげ図と幹葉表示

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。