BellCurve 統計WEB

  • Step0. 初級編
  • 10. データの読み方

10-2. データを分析して結果をまとめよう2

冷たい風が体を縮こませる2月―――布団から出るのも億劫な日が続きます。それでも皆、研究発表のためデータと格闘しながら、充実した時間を過ごしているようです。

次に示すのはみけの研究発表です。



みけ:わたしは、『ねこじゃらし公園には毎日どんな猫が来るのか』について研究を行いました。わたしの家はねこじゃらし公園の横にあるので、ねこじゃらし公園にどんな猫が来るかを調べるのは簡単かなと思ってこの研究に取り組んでみました。

みけ:まずはじめに、研究を行った期間の最高気温と天気、ねこじゃらし公園に来た猫の総数を表にまとめてみました。

日付最高気温(度)天気朝8時に公園にいた猫夕方5時に公園にいた猫
12/10(月)12はれ310
12/11(火)14くもり515
12/12(水)15はれ620
12/13(木)10あめ16
12/14(金)11くもり68
12/15(土)6はれ718
12/16(日)8はれ825
12/17(月)2くもり43
12/18(火)3ゆき12
12/19(水)8あめ112
12/20(木)4くもり36
12/21(金)5はれ56
12/22(土)7はれ621
12/23(日)11はれ419

みけ:このデータから、ねこじゃらし公園に朝8時にいた猫の数と夕方5時にいた猫の数の平均値を求めると4.3匹と12.2匹になりました。また、それぞれの時間にねこじゃらし公園にいた猫の数をドットプロットで表したのが次の図です。

先生:ドットプロットは、それぞれの値を点でプロットしたグラフのことで、データの大まかな分布を知りたいときに使います。グラフ中の黒の横線は平均値を表しています。

みけ:わたしが取ったデータは時系列のデータなので折れ線グラフも作ってみました。

みけ:このグラフを見ると、ねこじゃらし公園に朝いた猫より夕方いた猫のほうが多いということが分かります。また、朝いた猫の数は2週間を通してあまり大きく変わらなかったですが、夕方いた猫の数は気温が高いときや土日に多いという特徴がありました。

先生:折れ線グラフを使うのはとても良いですね。2つの異なる性質を持つデータを1つのグラフにする場合には左右の軸をそれぞれ使って表すことができます。

先生:みけのデータのうち「夕方5時に公園にいた猫の数」のように周期性があるデータの場合には、「自己相関」を算出することでその周期を確認することができます。

みけ:「朝8時に公園にいた猫の数」と「夕方5時に公園にいた猫の数」との間の相関関係の強さが気になったので、散布図を作って相関係数を計算してみました。その結果、相関係数は0.68で、中程度の相関が見られました。朝いた猫の数が多いほど夕方いた猫の数が多く、朝いた猫の数が少ないほど夕方いた猫の数が少ない傾向があることが分かりました。

みけ:最後に、「朝8時に公園にいた猫ののべ数」と「夕方5時に公園にいた猫ののべ数」におけるそれぞれの年齢層(子猫、成猫、老猫)の割合を円グラフにしました。

朝8時にねこじゃらし公園にいた猫ののべ数における各年齢層の割合

夕方17時にねこじゃらし公園にいた猫ののべ数における各年齢層の割合

みけ:わたしは友だちと遊ぶときにはねこじゃらし公園に行きます。いつも学校が終わった後にねこじゃらし公園に行って遊びます。このグラフから、朝は多くの老猫がねこじゃらし公園を使っていて、夕方は子猫が多く使っていることが分かりました。

みけ:この研究では2週間分のデータを使ってねこじゃらし公園に来る猫の数の分析を行いましたが、1年間を通して調査してみたらもっといろいろな傾向が分かるかもしれないと思いました。そして、もっとたくさんデータを集めれば、その日の気温などの情報を使ってねこじゃらし公園に来る猫の数が予想できるのではないかと思いました。

先生:みけの感想の中に、「ねこじゃらし公園に来る猫の数が予測できるのでは」というものがありました。何かの値を予測するためには、回帰分析を行って「予測値」を求める方法があります。

10. データの読み方


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)