BellCurve 統計WEB

  • Step1. 基礎編
  • 5. データの集計と表現

5-1. データの集計について

統計学では、様々なデータを集計したり分析したりします。しかしながら、手元にあるデータがどのようなものなのかは数字の羅列を見ただけではよく分かりません。このような場合には、「データを可視化する」、つまり一目見てデータの分布や特徴をつかめるようにすることが重要です。

■質的データの場合

得られたデータが質的データの場合、データの可視化にあたってはまずデータを「集計」します。集計とは、項目ごとにデータを数えたり合計したりした結果をまとめることで、集計したデータを用いて棒グラフや円グラフなどを作成することができます。

例えば、次に示す「あるクラス30人の好きなスポーツ」のデータについて考えてみます。

野球サッカー野球テニス野球
野球テニスサッカーサッカーテニス
サッカー水泳サッカーサッカーサッカー
サッカーテニス水泳水泳野球
野球野球野球サッカーサッカー
サッカーサッカーテニステニステニス

このデータを集計するにはまずすべての項目をピックアップします。そして、それぞれの項目の個数をカウントします。

スポーツ人数(人)
サッカー12
野球8
テニス7
水泳3

■量的データの場合

量的データを得た場合、まず平均値、最小値・最大値などの「基本統計量」を求めます。箱ひげ図を作成すると、四分位数に加えてデータのバラつきを捉えることができます。また、ヒストグラムを作成すると、データの分布を確認することができます。

例えば、「あるクラス30人の国語の点数」のデータから箱ひげ図とヒストグラムを作成すると次のようになります。

64565177457364446966
63538372586866746260
44484778545948575871

データの集計について1

データの集計について2

5. データの集計と表現


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)