BellCurve 統計WEB

  • Step0. 初級編
  • 6. データの標準化

6-2. データを標準化してみよう

体力テストが終わったことにほっとした「しま」の横で、「くろ」と「しろ」はどちらの成績が良かったのかをあーでもないこーでもないと言い合っているようです。そこで、もう一度6-1章の成績表を見直してみることになりました。

競技名くろしまみけ平均標準偏差
ボール投げ23442
走り幅跳び105661
50m走9455.51.2
高跳び53850.8
木登り54104.53

こんな時に使うのが「標準化」というデータの変換方法です。データを標準化すると、標準化したデータの平均は0に、分散(標準偏差も)は1になります。これにより、異なる項目のデータであってもその大小を比較できるようになります。すなわち、大きければ大きいほど成績が良いことを表します。

標準化は次の式から行います。xは元のデータを、\overline{x}は平均値を、sは標準偏差を表します。

 \displaystyle \frac{x- \overline{x}}{s}

例えば、「くろ」の「ボール投げ」のデータは次のように標準化できます。

 \displaystyle \frac{2-4}{2}=-1.0

同様にしてすべてのデータを標準化すると次のようになります。

競技名くろしまみけ
ボール投げ-1.0-0.50
走り幅跳び4.0-1.00
50m走2.9-1.3-0.4
高跳び0-2.53.8
木登り0.2-0.21.8

この結果を見ると、すべての競技の中で最も成績が良かったのは「くろ」の「走り幅跳び」の結果でした。

6. データの標準化