BellCurve 統計WEB

  • Step0. 初級編
  • 6. データの標準化

6-2. データを標準化してみよう

体力テストが終わったことにほっとした「しま」の横で、「くろ」と「みけ」はどちらの成績が良かったのかをあーでもないこーでもないと言い合っているようです。そこで、もう一度6-1章の成績表を見直してみることになりました。

競技名くろしまみけ
ボール投げ234
走り幅跳び1056
50m走945
高跳び538
木登り5410

また、次の表はくろ、しま、みけを含む1年生100匹全員の成績から計算した平均値と標準偏差です。

競技名平均標準偏差
ボール投げ42
走り幅跳び61
50m走5.51.2
高跳び50.8
木登り4.53

こんな時に使うのが「標準化」というデータの変換方法です。データを標準化すると、標準化したデータの平均は0に、分散(標準偏差も)は1になります。これにより、異なる項目のデータであってもその大小を比較できるようになります。すなわち、大きければ大きいほど成績が良いことを表します。

標準化は次の式から行います。xは元のデータを、\overline{x}は平均値を、sは標準偏差を表します。

 \displaystyle \frac{x- \overline{x}}{s}

例えば、「くろ」の「ボール投げ」のデータは次のように標準化できます。

 \displaystyle \frac{2-4}{2}=-1.0

同様にしてすべてのデータを標準化すると次のようになります。

競技名くろしまみけ
ボール投げ-1.0-0.50
走り幅跳び4.0-1.00
50m走2.9-1.3-0.4
高跳び0-2.53.8
木登り0.2-0.21.8

この結果を見ると、すべての競技の中で最も成績が良かったのは「くろ」の「走り幅跳び」の結果でした。

6. データの標準化


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)