- Step1. 基礎編
- 14. いろいろな確率分布2
14-3. 標準化したデータの使い方
ある確率変数が平均
、分散
の正規分布に従う時、
から平均
を引いて標準偏差
(※ 標準偏差=√分散)で割った値を
とおくと、
は「平均が
、分散が
の標準正規分布」に従います。したがって、標準化を行うことにより、単位や平均値などが異なるデータ同士を単純に比較できるようになります。
![Rendered by QuickLaTeX.com \displaystyle z=\frac{X-\mu}{\sigma}](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-bce071b9f1e5d1d42dcddaea95d10bc5_l3.png)
このような計算(データ変換)のことを「標準化」といいます。標準化した値を「値」、あるいは「標準化得点」と呼びます。
例題:
あるクラスの数学と国語のテストの結果は次の通りでした。
- 数学 平均点:
点 標準偏差:
点
- 国語 平均点:
点 標準偏差:
点
太郎君は数学が点、国語が
点でした。順位がより上なのはどちらの教科でしょうか。ただし、このクラスの数学および国語の点数はそれぞれ異なる(独立な)正規分布に従うものとします。
![図1](https://bellcurve.jp/statistics/wp-body/wp-content/uploads/2016/08/795316b92fc766b0181f6fef074f03fa-10.png)
点数だけを見ると、数学のほうが国語に比べて高くなっています。一方、国語のほうが数学に比べて平均点が低いので、国語のほうが平均点に対して良い点数をとっているとも言えそうです。このような場合には、それぞれの点数を標準化して比較します。
- 数学の点数(数学:
、
)
- 国語の点数(国語:
、
)
![Rendered by QuickLaTeX.com \displaystyle z_{math}=\frac{X-\mu}{\sigma}=\frac{80-60}{15}=1.3](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-934650915b6f850b444ff8931805caf8_l3.png)
![Rendered by QuickLaTeX.com \displaystyle z_{japanese}=\frac{X-\mu}{\sigma}=\frac{70-40}{20}=1.5](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-75ade855099f51841cec4e71d2557e10_l3.png)
したがって、となりました。標準化した値が大きいほど相対的な順位が高いことを示すので、太郎君の場合は数学よりも国語の方が順位は高いと言えます。
試験や模試の結果で登場する「偏差値」も、この標準化した値を用いて次の式から求められます。偏差値は「平均が
点、標準偏差が
点」となるように、標準化した値
に
をかけて
を足したものです。
![Rendered by QuickLaTeX.com 50+10\times z](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-b04fceb576a55749133ea924380d7730_l3.png)
太郎君のテスト結果から偏差値を算出してみます。
- 数学の偏差値:
- 国語の偏差値:
【コラム】偏差値は100を超える!?
偏差値は、試験や模試を受けた後に気になるものの1つではないでしょうか。偏差値は、教科ごとの点数の分布を「平均が点、標準偏差が
点」になるように変換した値です。もし平均点
と同じ点数をとった場合、標準化した値
は次のように
になるため、偏差値は
になります。
![Rendered by QuickLaTeX.com \displaystyle z=\frac{X-\mu}{\sigma}=\frac{\mu-\mu}{\sigma}=0](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-2ba270afa35de0ea98e18c774beb6603_l3.png)
次に平均点20点、標準偏差15点という試験で100点をとった場合の偏差値を計算してみます。このときの偏差値は以下のように103となり、100を超えます。
![Rendered by QuickLaTeX.com \displaystyle 50+10\times \frac{100-20}{15}=103](https://bellcurve.jp/statistics/wp-body/wp-content/ql-cache/quicklatex.com-65a395275eb254e281dde2fbac188b52_l3.png)
このように、偏差値はテストの点数と異なりを超えることがあります。これは計算間違いなどではなく、多くの受験生がほとんど同じような点数をとり(標準偏差が小さい)、かつ平均点が低い場合に高得点を取ると起こり得ます。また、偏差値が
未満となる場合もあります。
14. いろいろな確率分布2
事前に読むと理解が深まる- 学習内容が難しかった方に -
- 14. いろいろな確率分布2
14-1. 正規分布
- 14. いろいろな確率分布2
14-2. 正規分布の再生性と標準正規分布
- ブログ
正規分布の発見