BellCurve 統計WEB

  • Step1. 初級編
  • 5. データの集計と表現

5-1. データの集計について

統計学では、様々なデータを集計したり分析したりします。しかしながら、手元にあるデータがどのようなものなのかは数字の羅列を見ただけではよく分かりません。このような場合には、「データを可視化する」、つまり一目見てデータの分布や特徴をつかめるようにすることが重要です。

■質的データの場合

得られたデータが質的データの場合、データの可視化にあたってはまずデータを「集計」します。集計とは、項目ごとにデータを数えたり合計したりした結果をまとめることで、集計したデータを用いて棒グラフや円グラフなどを作成することができます。

例えば、次に示す「あるクラス30人の好きなスポーツ」のデータについて考えてみます。

野球サッカー野球テニス野球
野球テニスサッカーサッカーテニス
サッカー水泳サッカーサッカーサッカー
サッカーテニス水泳水泳野球
野球野球野球サッカーサッカー
サッカーサッカーテニステニステニス

このデータを集計するにはまずすべての項目をピックアップします。そして、それぞれの項目の個数をカウントします。

スポーツ人数(人)
サッカー12
野球8
テニス7
水泳3

■量的データの場合

量的データを得た場合、まず平均値、最小値・最大値などの「基本統計量」を求めます。箱ひげ図を作成すると、四分位数に加えてデータのバラつきを捉えることができます。また、ヒストグラムを作成すると、データの分布を確認することができます。

例えば、「あるクラス30人の国語の点数」のデータから箱ひげ図とヒストグラムを作成すると次のようになります。

64565177457364446966
63538372586866746260
44484778545948575871

データの集計について1

データの集計について2





5. データの集計と表現

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。