BellCurve 統計WEB

未経験からデータ分析が学べる
最大55万円の給付金還付
  • Step1. 基礎編
  • 2. 度数分布とヒストグラム

2-2. ヒストグラム


ヒストグラムは度数分布表をグラフにしたものです。2-1章で使用した各都道府県内にある映画館のスクリーン数のデータを用いてヒストグラムを作成すると次のようになります。

図1

横軸は「階級」を、縦軸は「度数」を表しています。例えば、横軸が「0~50」にある棒は「スクリーン数の合計が0以上50未満の都道府県の度数」を表します。このグラフを見ると、スクリーン数の合計が0以上100未満の都道府県が大半であるということが分かります。

次に示すように、ヒストグラムの各階級の棒を度数が大きい順に左から並べ替え、その上に累積相対度数の折れ線グラフを重ねる場合もあります。このようなグラフを「パレート図」といいます。横軸は先ほどと同じ「階級」を、左側の縦軸は「度数」を、右側の縦軸は「累積相対度数」を表しています。

図2

赤い折れ線グラフを見ると、スクリーン数の合計が「0以上50未満」の都道府県は全体の約50%強であることが分かります。また、スクリーン数の合計が「0以上100未満」の都道府県は全体の約80%であることが分かります。

図3

このようにヒストグラムを描くと、データの分布を視覚的に捉えることができます。例えば次の図のように、データの分布の山(度数の多い部分)が左側に偏り、右に行くにつれて山がなだらかになっている(度数が少ない)ヒストグラムのことを「右裾が長い」もしくは「右に歪んだ」もしくは「左に偏った」分布といいます。

図4

一方、次の図のようにデータの分布の山(度数の多い部分)が右側に偏り、左に行くにつれて山がなだらかになっている(度数が少ない)ヒストグラムのことを「左裾が長い」もしくは「左に歪んだ」もしくは「右に偏った」分布といいます。

図5

【コラム】棒グラフとヒストグラムはどのように使い分けるのか

ヒストグラムは棒グラフの"棒の隙間"を埋めただけではないのか?と思う人がいるかも知れませんが、これらは明確なちがいがあります。手元にあるデータが、1-4. 変数の尺度で学んだ「質的データ」か「量的データ」であるかによって、これらのグラフを使い分けます。

棒グラフは「質的データ」の可視化に使います。例えば、5-2. 棒グラフ・円グラフ・折れ線グラフに掲載している棒グラフのように、ある学校の定期試験の平均点のデータは棒グラフで表します。棒の高さを見て、それぞれの値を比較することができます。

一方のヒストグラムは「量的データ」の可視化に使います。量的データから作成した度数分布表をグラフにしたものがヒストグラムなので、ヒストグラムを見るとそのデータの分布を知ることができます。


2. 度数分布とヒストグラム

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)