BellCurve 統計WEB

【BellCurveシリーズ】 統計解析ソフト「エクセル統計」をAmazonにて好評発売中!

■エクセル統計が選ばれている3つの理由

  • 特徴1. Excelのメニューに統計解析の手法が追加される
  • 特徴2. すべての手法が1つに収められているから買い足し不要
  • 特徴3. 使いやすくコスパに優れた国内売上1位の統計解析ソフト
  • Step1. 基礎編
  • 2. 度数分布とヒストグラム

2-3. 階級幅の決め方

ヒストグラムを作る際に大事な点は、階級の幅(度数を集計するための区間の大きさ)をどのくらいの大きさにするかという点です。2-1章で使用した各都道府県内にある映画館のスクリーン数のデータを用いて2つのヒストグラムを作成してみました。

■階級の幅が200のヒストグラム

■階級の幅が18のヒストグラム

階級幅が200のヒストグラムでは、都道府県ごとのスクリーン数の分布がよく分かりません。一方、階級幅が18ののヒストグラムでは分布は分かるもののやや細か過ぎる印象を与えます。さらに階級の区切り方が中途半端であるため、階級値が分かりづらくなってしまっています。

階級の幅の決め方にルールはありませんが、グラフを一目見て分布の特徴が捉えられるようにすることが推奨されます。階級幅が大きすぎても、逆に小さすぎてもデータの大まかな分布が分かりづらくなってしまいます。階級幅の決め方で困った場合には、「スタージェスの公式」を使うこともできます。この式を使うと、目安となる階級の数が算出できます。

■スタージェスの公式

階級の数=\bf 1+log_{2}n  (nはデータ数)

例えば47都道府県のデータの場合、階級の数=1+log_{2}47=6.55\fallingdotseq7となり、2-1章で作成した度数分布表の階級の数である「8」とだいたい一致します。したがって、都道府県ごとのスクリーン数のデータのヒストグラムは8個の階級数で十分であることが分かります。





2. 度数分布とヒストグラム

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定2級対策に最適な模擬問題集を各500円(税込)にて販売中!

Kindleストアで配信中