- Step1. 基礎編
- 2. 度数分布とヒストグラム
2-1. 度数分布と累積度数分布
次のデータは、一般社団法人 日本映画製作者連盟が発表している2015年12月末時点の各都道府県内にある映画館のスクリーンの合計数です。ある県に1つの映画館があり、その映画館に10個のスクリーンがあった場合、スクリーン数は10となります。
都道府県 | 各都道府県内の合計スクリーン数 |
---|---|
東京 | 358 |
神奈川 | 208 |
千葉 | 199 |
︙ | ︙ |
宮崎 | 18 |
鹿児島 | 31 |
北海道 | 113 |
沖縄 | 40 |
このデータの大まかな分布を知るために、データをある幅ごとに区切ってその中に含まれるデータの個数を見るという方法があります。このような表のことを「度数分布表」といいます。次の表は、各都道府県内の合計スクリーン数を度数分布表にまとめたものです。
①階級 | ②階級値 | ③度数 | ④相対度数 | ⑤累積相対度数 |
---|---|---|---|---|
0以上50未満 | 25 | 24 | 0.5106 | 0.5106 |
50以上100未満 | 75 | 14 | 0.2979 | 0.8085 |
100以上150未満 | 125 | 2 | 0.0426 | 0.8511 |
150以上200未満 | 175 | 2 | 0.0426 | 0.8936 |
200以上250未満 | 225 | 3 | 0.0638 | 0.9574 |
250以上300未満 | 275 | 1 | 0.0213 | 0.9787 |
300以上350未満 | 325 | 0 | 0.0000 | 0.9787 |
350以上400未満 | 375 | 1 | 0.0213 | 1.0000 |
合計 | - | 47 | 1.0000 | - |
①「階級」:度数を集計するための区間を表します。この度数分布表ではスクリーン数を50ごとに区切った区間が階級です。
②「階級値」:その階級を代表する値のことで、階級の真ん中の値となります。スクリーン数の合計が「0以上50未満」の階級であれば、階級値は「25」となります。
③「度数」:各階級に含まれるデータ数を表します。例えば、都道府県内にある映画館のスクリーン数の合計が0以上50未満の都道府県は「24個」あるということを意味します。
④「相対度数」:各階級の度数が全体に占める割合のことです。スクリーン数の合計が「0以上50未満」の階級であれば「(「47」は全ての都道府県の数)」となります。
⑤「累積相対度数」:その階級までの相対度数の全ての和(累積和)のことで、以下のように計算されます。
- スクリーン数の合計が「0以上50未満」の階級:(相対度数と等しい)
- スクリーン数の合計が「50以上100未満」の階級:
- スクリーン数の合計が「100以上150未満」の階級:
︙
- スクリーン数の合計が「350以上400未満」の階級 :
2. 度数分布とヒストグラム
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 統計解析事例
度数分布とヒストグラム─エクセル統計による解析事例