「平均」のこと
2017/08/13
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
英語には平均値を表す言葉としてaverageとmeanの2つがあります。一般に、averageも mean も特にことわりがなければ「算術平均(Arithmetic mean)」を意味します。
統計学の世界では average と mean を使い分けており、いわゆる平均値には mean を用いるのが常識です。
average には mean よりも広い意味を持たせていて、「代表値」という訳語をあてます。代表値とは「分布の中心的位置を表す数値(measure of central tendency)」を意味し、平均値以外に、中央値(median、50パーセンタイル値)や最頻値(mode)も含まれます。平均値であることを明確にするために、統計学ではmeanを使うようになったのではと思います。
ところで、Microsoft(R) Excel で平均値を求める関数の名前は AVERAGE です。MEDIAN や MODE と同じく統計関数に分類されています。一般的な馴染み度や、統計学や数学から離れるとmeanにも色々な意味があることから AVERAGE に決めたものと思いますが、統計関数の括りに入れるのなら MEAN が妥当だったのではないでしょうか。
さて、Excel の統計関数を眺めていると、ほかにも mean と名がつく関数があります。
GEOMEAN(Geometric mean、幾何平均、相乗平均)
HARMEAN(Harmonic mean、調和平均)
TRIMEAN(Trimmed mean、調整平均)
幾何平均は、n個の変数の積を求めて、n乗根をとったものです。比率の平均をもとめるときなどに、よく利用します。
過去3年の売上高の対前年比、120%、110%、130%の幾何平均を求めるなら Excel には次のように入力します。
=GEOMEAN(1.2,1.1,1.3)
次のように入力したのと同じ結果です。
=(1.2*1.1*1.3)^(1/3)
=EXP(AVERAGE(LN(1.2),LN(1.1),LN(1.3)))
結果は1.19725になります。3年間の売上のトータルの伸びは、毎年19.7%ずつ売上が伸びたのに等しいということですね。
このほかに、幾何平均が あてはまる例として、
XとYの2つの変数について、
XからYへの回帰式と、
Y = a + bX
YからXへの回帰式を求めて、
X = a' + b'Y
それぞれの回帰係数bとb'の 幾何平均を求めると、 相関係数に一致するというのがあります。
r = √bb'
調和平均は、速度の平均などに用いることができます。例えば、山頂まで6kmの道のりを往きは時速2kmで帰りは時速6kmで歩いたときの平均時速を、Excel では次のように入力して解くことができます。
=HARMEAN(2,6)
結果は3になります。往復で12kmを4時間かけて歩いたので時速3kmと いうことです。
調和平均は 逆数の算術平均を求め、 結果の逆数をとったものなので、次の式を入力しても解くことができます。
=AVERAGE(1/2,1/6)^-1
最後の調整平均は、最初にデータを値の大きさで並び替え、 次に、両端を除いて算術平均を 求めたものです。
2,2,3,4,6,7,9,10,12,13
という10個の値があるときに、
=TRIMMEAN(データの範囲,0.2)
と入力すると、両端から10%ずつということで、2と13を除いた8個(80%)から平均を求めるので、結果は6.625になります。これを10%調整平均といいます。
Excel のTRIMMEAN関数では、10%調整平均なら、片側分の「0.1」ではなく「0.2」と指定します。両側分の割合を指定することに要注意です。
調整平均は、外れ値(極端な値)の影響を避けるために使います。25%調整平均のことを中央平均(Midmean、Interquartile mean)とも言います。
Excel を離れると、一般化平均(Generalized mean)など、他にもまだまだ平均と名の付くものがあります。次回は、特殊な平均について取り上げてみたいと思います。