BellCurve 統計WEB

  • Step1. 基礎編
  • 4. 箱ひげ図と幹葉表示

4-2. 箱ひげ図の見方

■パーセンタイル

箱ひげ図の見方を説明する前に、「パーセンタイル」について触れます。パーセンタイルは「データを小さい順で並べたとき、ある数値がデータの小さい方から見て何%の位置にあるかを表すもの」です。0パーセンタイルは最小値を、100パーセンタイルは最大値を表します。Nパーセンタイルは、データ全体をN%と100-N%で分割する値です。

例えば、4‐1章の15人分の体重のデータを用いて30パーセンタイルを表すと、次のようになります。

箱ひげ図の見方2

■四分位数

箱ひげ図には最大値、最小値に加えて「四分位数」の情報が含まれています。四分位数はデータを小さい順に並べて、小さいものから順位を付けた時に、

  • 25%(全体の1/4の部分)=25パーセンタイル
  • 50%(全体の2/4=1/2の部分)=50パーセンタイル
  • 75%(全体の3/4の部分)=75パーセンタイル

に該当する値のことです。

箱ひげ図の見方1

これらの3つの値は次のように呼ばれます。

箱ひげ図の見方3

この3つの四分位数で区切ると、データの個数を4等分することができます。また、第三四分位数から第一四分位数を引いたものを四分位範囲(Inter Quarter Range 略してIQR)といいます。

■5数要約(five-number summary)

「最小値」、「第一四分位数」、「中央値」、「第三四分位数」、「最大値」の5つの値をまとめて「5数要約」といいます。また、最大値から最小値を引いたものを「範囲」といいます。

■箱ひげ図へのあてはめ

四分位数の値を箱ひげに当てはめると次のようになります。

箱ひげ図の見方4

【コラム】箱ひげ図とデータの数

四分位数によってデータは次の4つに区分できます。

  • 区間D:ひげの上端(最大値)から箱の上端(第三四分位)まで
  • 区間C:箱の上端(第三四分位)から箱の中央の線(中央値)まで
  • 区間B:箱の中央の線(中央値)から箱の下端(第一四分位)まで
  • 区間A:箱の下端(第一四分位)からひげの下端(最小値)まで

箱ひげ図の見方5

A、B、C、Dの4区間のなかに、それぞれ同じ個数だけデータが入っています。しかし、同じ個数でもその区間の長さが異なることから、データのばらつき具合を知ることができます。

例えば、区間Bと区間Dでは、区間Bの方が区間が短いことからよりデータが集中していることが分かります。また、箱の高さ(区間Bと区間Cを合わせたもの)は全データの半分のデータを表すことから、およそ「57」から「78」の範囲に全体の半分のデータが存在することが読み取れます。

■おすすめ書籍

Excelで見やすくキレイなグラフを書くときに重宝します。とてもわかり易いです。

4. 箱ひげ図と幹葉表示

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)