BellCurve 統計WEB

  • Step0. 初級編
  • 6. データの標準化

6-2. データを標準化してみよう

体力テストが終わったことにほっとした「しま」の横で、「くろ」と「しろ」はどちらの成績が良かったのかをあーでもないこーでもないと言い合っているようです。そこで、もう一度6-1章の成績表を見直してみることになりました。

競技名くろしまみけ
ボール投げ234
走り幅跳び1056
50m走945
高跳び538
木登り5410

また、次の表は1年生全員の成績から計算した平均値と標準偏差です。

競技名平均標準偏差
ボール投げ42
走り幅跳び61
50m走5.51.2
高跳び50.8
木登り4.53

こんな時に使うのが「標準化」というデータの変換方法です。データを標準化すると、標準化したデータの平均は0に、分散(標準偏差も)は1になります。これにより、異なる項目のデータであってもその大小を比較できるようになります。すなわち、大きければ大きいほど成績が良いことを表します。

標準化は次の式から行います。xは元のデータを、\overline{x}は平均値を、sは標準偏差を表します。

 \displaystyle \frac{x- \overline{x}}{s}

例えば、「くろ」の「ボール投げ」のデータは次のように標準化できます。

 \displaystyle \frac{2-4}{2}=-1.0

同様にしてすべてのデータを標準化すると次のようになります。

競技名くろしまみけ
ボール投げ-1.0-0.50
走り幅跳び4.0-1.00
50m走2.9-1.3-0.4
高跳び0-2.53.8
木登り0.2-0.21.8

この結果を見ると、すべての競技の中で最も成績が良かったのは「くろ」の「走り幅跳び」の結果でした。

6. データの標準化