BellCurve 統計WEB

  • Step1. 初級編
  • 14. いろいろな確率分布2

14-3. 標準化したデータの使い方

ある確率変数Xが平均\mu、分散\sigma^{2}正規分布に従う時、Xから平均\muを引いて標準偏差\sigma(※ 標準偏差=√分散)で割った値をzとおくと、zは「平均が0、分散が1標準正規分布」に従います。したがって、標準化を行うことにより、単位や平均値などが異なるデータ同士を単純に比較できるようになります。

 \displaystyle z=\frac{X-\mu}{\sigma}

このような計算(データ変換)のことを「標準化」といいます。標準化した値を「z値」、あるいは「標準化得点」と呼びます。

例題:

あるクラスの数学と国語のテストの結果は次の通りでした。

  • 数学 平均点:60点 標準偏差:15
  • 国語 平均点:40点 標準偏差:20

太郎君は数学が80点、国語が70点でした。順位がより上なのはどちらの教科でしょうか。ただし、このクラスの数学および国語の点数はそれぞれ異なる(独立な)正規分布に従うものとします。

図1

点数だけを見ると、数学のほうが国語に比べて高くなっています。一方、国語のほうが数学に比べて平均点が低いので、国語のほうが平均点に対して良い点数をとっているとも言えそうです。このような場合には、それぞれの点数を標準化して比較します。

  • 数学の点数(数学:\mu=60\sigma=15
  •  \displaystyle z_{math}=\frac{X-\mu}{\sigma}=\frac{80-60}{15}=1.3
  • 国語の点数(国語:\mu=40\sigma=20
  •  \displaystyle z_{japanese}=\frac{X-\mu}{\sigma}=\frac{70-40}{20}=1.5

したがって、z_{japanese}>z_{math}となりました。標準化した値が大きいほど相対的な順位が高いことを示すので、太郎君の場合は数学よりも国語の方が順位は高いと言えます。

試験や模試の結果で登場する「偏差値」も、この標準化した値zを用いて次の式から求められます。偏差値は「平均が50点、標準偏差が10点」となるように、標準化した値z10をかけて50を足したものです。

 50+10\times z

太郎君のテスト結果から偏差値を算出してみます。

  • 数学の偏差値:50+10\times 1.3=63
  • 国語の偏差値:50+10\times 1.5=65

【コラム】偏差値は100を超える!?

偏差値は、試験や模試を受けた後に気になるものの1つではないでしょうか。偏差値は、教科ごとの点数の分布を「平均が50点、標準偏差が10点」になるように変換した値です。もし平均点\muと同じ点数をとった場合、標準化した値zは次のように0になるため、偏差値は50+10\times z=50+10\times 0=50になります。

 \displaystyle z=\frac{X-\mu}{\sigma}=\frac{\mu-\mu}{\sigma}=0

次に平均点20点、標準偏差15点という試験で100点をとった場合の偏差値を計算してみます。このときの偏差値は以下のように103となり、100を超えます。

 \displaystyle 50+10\times \frac{100-20}{15}=103

このように、偏差値はテストの点数と異なり100を超えることがあります。これは計算間違いなどではなく、多くの受験生がほとんど同じような点数をとり(標準偏差が小さい)、かつ平均点が低い場合に高得点を取ると起こり得ます。また、偏差値が0未満となる場合もあります。





14. いろいろな確率分布2

事前に読むと理解が深まる- 学習内容が難しかった方に -

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。