- Step1. 基礎編
- 1. 統計ことはじめ
1-4. 変数の尺度
統計学では、変数をその性質に応じて4つの尺度に分けて考えることがあります。Wikipediaによると、提案したのはスタンレー・スティーブンズ(Stanley Smith Stevens)です。1946年にサイエンス誌に発表された"On the theory of scales of measurement"という論文の中で、変数の4つの尺度、「名義尺度」「順序尺度」「間隔尺度」「比例尺度」について説明しています。
それぞれの尺度については具体例を見たほうが分かりやすいと思いますので、次に例を示します。
■名義尺度
- 他と区別し分類するための名称のようなもの
- 例:男女、血液型、郵便番号、住所、本籍地、所属学部、学籍番号
- 使える統計量:各ケースの数、計数(count)、頻度(frequency)、最頻値、連関係数
■順序尺度
- 順序や大小には意味があるが間隔には意味がないもの
- 例えば、1位+2位≠3位のように、足し算引き算ができないもの
- 例:1位 / 2位 / 3位…、1. 好き / 2. ふつう / 3. 嫌い、統計検定®1級 / 2級 / 3級 / 4級、がんのステージ分類におけるステージI / II / III / IV
- 使える統計量:中央値、パーセンタイル
■間隔尺度
- 目盛が等間隔になっているもので、その間隔に意味があるもの
- 例えば、気温が19℃から1℃上昇すると20℃になるとは言えるが、10℃から20℃に上昇したとき、2倍になったとは言えないもの
- 例:気温(摂氏)、西暦、テストの点数
- 使える統計量:平均値、標準偏差、順位相関係数、積率相関係数(いわゆる相関係数のこと)
■比例尺度
- 0が原点であり、間隔と比率に意味があるもの
- 例えば、身長が150cmから30cm伸びると180cmになると言えるし、1.2倍になったとも言えるもの
- 例:身長、速度、睡眠時間、値段、給料、幅跳びの記録
- 使える統計量:変動係数
4つの尺度は、名義<順序<間隔<比例という上下関係があり、上位の尺度は下位の尺度の統計量を用いることができます。なお、現在では順序尺度に対しても順位相関係数を使うことがあります。
「間隔尺度」と「比例尺度」は非常に見分けづらい場合があります。この2つの尺度を見分けるコツは、「0の値に相対的ではなく絶対的な意味があるかどうか」を考えることです。温度や西暦は「0」だったとしても、その温度や西暦が「無い」わけではありません。一方で、身長や速度が「0」であるときは、本当に「無い」ときです。
別の例を考えてみます。「体重」が「0kg」の場合、体重が「無い」ことになるので「比例尺度」になります。「テストの点数」や「偏差値」が「0」の場合、点数や偏差値が「無い」ということを示すわけではない(0だとしてもそれはあくまで点数や偏差値が0という値であったということを示す)ので「間隔尺度」になります。
「間隔尺度」と「比例尺度」を見分ける別のコツは、「比をとることができるかどうか」を考えることです。西暦は1000年から1500年になったときに1.5倍になったとは言えませんが、値段は1000円から1500円になったときに1.5倍になったと言えます。
【コラム】4尺度以外の変数の分け方
変数については、この章で挙げた4つの尺度以外にもう少し大まかな分け方もあります。「質的変数」と「量的変数」という分け方で、名義尺度と順序尺度は質的変数に属し、間隔尺度と比例尺度は量的変数に属します。質的変数については「カテゴリー変数(categorical variable、カテゴリカル変数ともいいます)」という呼び方もあります。
また、別の分け方として「離散変数(discrete variable)」と「連続変数(continuous variable)」という分類があります。「離散変数」はとびとびの値をとる変数のことで、例えばさいころの出る目などがあります。「連続変数」は重さや温度などのように連続した値をとる変数のことです。