BellCurve 統計WEB

無料登録してPythonを学ぶ
無料講座5つプレゼント
  • Step1. 基礎編
  • 14. いろいろな確率分布2

14-3. 標準化したデータの使い方


ある確率変数Xが平均\mu、分散\sigma^{2}正規分布に従う時、Xから平均\muを引いて標準偏差\sigma(※ 標準偏差=√分散)で割った値をzとおくと、zは「平均が0、分散が1標準正規分布」に従います。したがって、標準化を行うことにより、単位や平均値などが異なるデータ同士を単純に比較できるようになります。

 \displaystyle z=\frac{X-\mu}{\sigma}

このような計算(データ変換)のことを「標準化」といいます。標準化した値を「z値」、あるいは「標準化得点」と呼びます。

例題:

あるクラスの数学と国語のテストの結果は次の通りでした。

  • 数学 平均点:60点 標準偏差:15
  • 国語 平均点:40点 標準偏差:20

太郎君は数学が80点、国語が70点でした。順位がより上なのはどちらの教科でしょうか。ただし、このクラスの数学および国語の点数はそれぞれ異なる(独立な)正規分布に従うものとします。

図1

点数だけを見ると、数学のほうが国語に比べて高くなっています。一方、国語のほうが数学に比べて平均点が低いので、国語のほうが平均点に対して良い点数をとっているとも言えそうです。このような場合には、それぞれの点数を標準化して比較します。

  • 数学の点数(数学:\mu=60\sigma=15
  •  \displaystyle z_{math}=\frac{X-\mu}{\sigma}=\frac{80-60}{15}=1.3
  • 国語の点数(国語:\mu=40\sigma=20
  •  \displaystyle z_{japanese}=\frac{X-\mu}{\sigma}=\frac{70-40}{20}=1.5

したがって、z_{japanese}>z_{math}となりました。標準化した値が大きいほど相対的な順位が高いことを示すので、太郎君の場合は数学よりも国語の方が順位は高いと言えます。

試験や模試の結果で登場する「偏差値」も、この標準化した値zを用いて次の式から求められます。偏差値は「平均が50点、標準偏差が10点」となるように、標準化した値z10をかけて50を足したものです。

 50+10\times z

太郎君のテスト結果から偏差値を算出してみます。

  • 数学の偏差値:50+10\times 1.3=63
  • 国語の偏差値:50+10\times 1.5=65

【コラム】偏差値は100を超える!?

偏差値は、試験や模試を受けた後に気になるものの1つではないでしょうか。偏差値は、教科ごとの点数の分布を「平均が50点、標準偏差が10点」になるように変換した値です。もし平均点\muと同じ点数をとった場合、標準化した値zは次のように0になるため、偏差値は50+10\times z=50+10\times 0=50になります。

 \displaystyle z=\frac{X-\mu}{\sigma}=\frac{\mu-\mu}{\sigma}=0

次に平均点20点、標準偏差15点という試験で100点をとった場合の偏差値を計算してみます。このときの偏差値は以下のように103となり、100を超えます。

 \displaystyle 50+10\times \frac{100-20}{15}=103

このように、偏差値はテストの点数と異なり100を超えることがあります。これは計算間違いなどではなく、多くの受験生がほとんど同じような点数をとり(標準偏差が小さい)、かつ平均点が低い場合に高得点を取ると起こり得ます。また、偏差値が0未満となる場合もあります。


14. いろいろな確率分布2

事前に読むと理解が深まる- 学習内容が難しかった方に -


統計学やデータ分析を学ぶなら、大人のための統計教室 和(なごみ) [業務提携]


統計WEBを運営するBellCurveは、統計解析ソフト「エクセル統計」を開発・販売しています! 統計解析ソフト「エクセル統計」をインストール後のExcel上のタブとメニュー エクセル統計ジャケット画像


【BellCurve監修】統計検定®2級対策に最適な模擬問題集1~3を各500円(税込)にて販売中!

Kindleストアで配信中

統計検定®2級 模擬問題集1

500円(税込)

統計検定®2級 模擬問題集2

500円(税込)

統計検定®2級 模擬問題集3

500円(税込)