BellCurve 統計WEB

  • Step1. 初級編
  • 2. 度数分布とヒストグラム

2-1. 度数分布と累積度数分布

次のデータは、一般社団法人 日本映画製作者連盟が発表している2015年12月末時点の各都道府県内にある映画館のスクリーンの合計数です。ある県に1つの映画館があり、その映画館に10個のスクリーンがあった場合、スクリーン数は10となります。

都道府県各都道府県内の合計スクリーン数
東京358
神奈川208
千葉199
宮崎18
鹿児島31
北海道113
沖縄40

このデータの大まかな分布を知るために、データをある幅ごとに区切ってその中に含まれるデータの個数を見るという方法があります。このような表のことを「度数分布表」といいます。次の表は、各都道府県内の合計スクリーン数を度数分布表にまとめたものです。

①階級②階級値③度数④相対度数⑤累積相対度数
0以上50未満25240.51060.5106
50以上100未満75140.29790.8085
100以上150未満12520.04260.8511
150以上200未満17520.04260.8936
200以上250未満22530.06380.9574
250以上300未満27510.02130.9787
300以上350未満32500.00000.9787
350以上400未満37510.02131.0000
合計471.0000

①「階級」:度数を集計するための区間を表します。この度数分布表ではスクリーン数を50ごとに区切った区間が階級です。

②「階級値」:その階級を代表する値のことで、階級の真ん中の値となります。スクリーン数の合計が「0以上50未満」の階級であれば、階級値は「25」となります。

③「度数」:各階級に含まれるデータ数を表します。例えば、都道府県内にある映画館のスクリーン数の合計が0以上50未満の都道府県は「24個」あるということを意味します。

④「相対度数」:各階級の度数が全体に占める割合のことです。スクリーン数の合計が「0以上50未満」の階級であれば「24  \div 47=0.5106(「47」は全ての都道府県の数)」となります。

⑤「累積相対度数」:その階級までの相対度数の全ての和(累積和)のことで、以下のように計算されます。

  • スクリーン数の合計が「0以上50未満」の階級:0.5106(相対度数と等しい)
  • スクリーン数の合計が「50以上100未満」の階級:0.5106+0.2979=0.8055
  • スクリーン数の合計が「100以上150未満」の階級:0.5106+0.2979+0.0426=0.8511

           ︙

  • スクリーン数の合計が「350以上400未満」の階級 :0.5106+0.2979+0.0426+0.0426+0.0638+0.0213+0.0000+0.0213=1.0000

2. 度数分布とヒストグラム

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。