統計記号の使い方
2017/08/14
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
本や論文を読んでいると統計記号や略語が色々と出てきますが、同じ意味なのに著者や分野によって微妙に表記や意味が違って戸惑うことがあります。アメリカ心理学会(APA)のように、学会によっては論文作成マニュアルでかなり細かく執筆要領を定めているところもありますが、ルールを明示していない学会の方が多いのではないでしょうか。表記の揺らぎは避けられないことのようです。
1つの例として P の使い方を見てみましょう。『国際誌にアクセプトされる医学論文』では、P は「確率( 0 から 1 の範囲)」とされていますが、『APA論文作成マニュアル(日本語版は2011年3月に第2版を出版)』では、P は「百分率、百分位(パーセント、パーセンタイル)」です。APA で確率を意味する統計記号は小文字の p です。コンピューターを使って文字を入力していると、小文字を入力したつもりでも勝手に大文字に変換されてしまうので、この使い分けには苛々させられます。
なお、両者に共通している統計記号としては、次のものなどがあげられます。
N 集団全体の標本の大きさ
n 部分集団の標本の大きさ
R 重相関係数
r ピアソンの積率相関係数、いわゆる(単)相関係数のこと
F フィッシャーの F
t t 分布の検定統計量
ただし、APA の執筆要領では、これらの統計記号はイタリック体として活字に組み込むとしています。しかしながら、HTML ではイタリック体は文字がきれいに表示されないので、ここでは標準書体にしてあります。HTML に限らずソフトウェアの出力としても、標準書体とイタリック体を使い分けるのはやっかいなことです。
ところで、F 分布の F が大文字なのに、t 分布の t が小文字なのは、統計初心者にとって使い分けの理由が分からないところです。実のところ、大文字小文字の使い分けは発明者に委ねられていて、そこに明確なルールはありません。 F は F 分布を考えたフィッシャーの頭文字をとったものです。t 分布はゴセットの発明ですが、ゴセットが実名を出したくなかったので、後に、フィッシャーが分布を定式化したときに使った t の文字から、t 分布と呼ばれるようになりました。
表記の揺らぎは避けられないことなので、『APA論文作成マニュアル』では、本文中で統計用語を使うときは、記号でなく用語そのものを使うようにと注意してあります。同じ理由から、本や論文を読むときは数式や数表だけを見るのではなく、本文中で記号の意味を必ず確認しておくべきでしょう。