- Step1. 基礎編
- 4. 箱ひげ図と幹葉表示
4-2. 箱ひげ図の見方
■パーセンタイル
箱ひげ図の見方を説明する前に、「パーセンタイル」について触れます。パーセンタイルは「データを小さい順で並べたとき、ある数値がデータの小さい方から見て何%の位置にあるかを表すもの」です。0パーセンタイルは最小値を、100パーセンタイルは最大値を表します。Nパーセンタイルは、データ全体をN%と100-N%で分割する値です。
例えば、4‐1章の15人分の体重のデータを用いて30パーセンタイルを表すと、次のようになります。
■四分位数
箱ひげ図には最大値、最小値に加えて「四分位数」の情報が含まれています。四分位数はデータを小さい順に並べて、小さいものから順位を付けた時に、
- 25%(全体の1/4の部分)=25パーセンタイル
- 50%(全体の2/4=1/2の部分)=50パーセンタイル
- 75%(全体の3/4の部分)=75パーセンタイル
に該当する値のことです。
これらの3つの値は次のように呼ばれます。
この3つの四分位数で区切ると、データの個数を4等分することができます。また、第三四分位数から第一四分位数を引いたものを四分位範囲(Inter Quarter Range 略してIQR)といいます。
■5数要約(five-number summary)
「最小値」、「第一四分位数」、「中央値」、「第三四分位数」、「最大値」の5つの値をまとめて「5数要約」といいます。また、最大値から最小値を引いたものを「範囲」といいます。
■箱ひげ図へのあてはめ
四分位数の値を箱ひげに当てはめると次のようになります。
【コラム】箱ひげ図とデータの数
四分位数によってデータは次の4つに区分できます。
- 区間D:ひげの上端(最大値)から箱の上端(第三四分位)まで
- 区間C:箱の上端(第三四分位)から箱の中央の線(中央値)まで
- 区間B:箱の中央の線(中央値)から箱の下端(第一四分位)まで
- 区間A:箱の下端(第一四分位)からひげの下端(最小値)まで
A、B、C、Dの4区間のなかに、それぞれ同じ個数だけデータが入っています。しかし、同じ個数でもその区間の長さが異なることから、データのばらつき具合を知ることができます。
例えば、区間Bと区間Dでは、区間Bの方が区間が短いことからよりデータが集中していることが分かります。また、箱の高さ(区間Bと区間Cを合わせたもの)は全データの半分のデータを表すことから、およそ「57」から「78」の範囲に全体の半分のデータが存在することが読み取れます。
■おすすめ書籍
Excelで見やすくキレイなグラフを書くときに重宝します。とてもわかり易いです。
4. 箱ひげ図と幹葉表示
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 統計Tips
箱ひげ図の作り方(棒グラフ編)
- 統計Tips
箱ひげ図の作り方(株価チャート編)
- 統計解析事例
記述統計量
- 統計解析事例
箱ひげ図