BellCurve 統計WEB

  • Step1. 初級編
  • 32. その他

32-3. 移動平均

株価や気温など時間で細かく変化するデータを眺めるとき、変動が細かすぎて全体の傾向を掴みにくい場合があります。そのようなときには「移動平均」を用いることで、変化をより滑らかにしてデータを俯瞰できます。

次のデータは、2015年8月の新宿御苑における1時間ごとの気温の測定結果です。毎時データなので、日中と夜間の気温変化を読み取ることはできますが、8月全体を通しての変動は簡単には読み取れそうにありません。

このような場合には、移動平均を取るとデータが見やすくなります。次のグラフは区間数24の移動平均を取ったものです。このグラフを見ると、8月上旬は気温が高く、その後9月に近づくにつれて気温が低下しているということが分かります。

■移動平均の求め方

最も簡単な移動平均は、直近データの単純相加平均を計算することによって求められます。具体的には、移動平均を求めたい中心となるデータから前後のいくつかのデータ(項)を足して、平均をとるという方法です。前後いくつ分の項を考慮するかは場合によって異なり、「区間数n」や「n項移動平均」といった記述によりその数を表します。区間数がnのとき、全部でn個分の項の平均を計算します。

例えば、次のように1から10までの連番データがあった場合に、5番目の項の3項移動平均ma_{5}は次のように求められます。

移動平均の計算方法は、移動平均を取る区間が奇数か偶数かによって異なります。5項移動平均は、中心となる項から前後2個ずつの項を足して、5で割ると計算できます。一方で6項移動平均は、中心となる項から前後3個ずつの項を足していますが、一番離れているx_{i-3}x_{i+3}についてはどちらも0.5倍されています。

  • 5項の移動平均の式
  •  \displaystyle ma_i = \frac{x_{i-2}+x_{i-1}+x_{i}+x_{i+1}+x_{i+2}}{n}
  • 6項の移動平均の式
  •  \displaystyle ma_i = \frac{0.5 \times x_{i-3}+x_{i-2}+x_{i-1}+x_{i}+x_{i+1}+x_{i+2}+0.5 \times x_{i+3}}{n}

このように偶数の場合は、一番離れている項については0.5倍して計算する必要があります。

■移動平均の計算方法のまとめ(Nが奇数のとき)

N=2k+1となるようなkを用いて表すと次のようになります。

     \begin{eqnarray*} \displaystyle ma_{i} &=& \frac{1}{n}(x_{i-k}+x_{i-(k-1)}+ \cdots +x_{i-1}+x_{i}+x_{i+1}+ \cdots +x_{i+(k-1)}+x_{i+k}) \\ &=&\frac{1}{n}\left\{x_{i}+\sum_{j=1}^k (x_{i-j}+x_{i+j})\right\} \end{eqnarray*}

■移動平均の計算方法のまとめ(Nが偶数のとき)

N=2kとなるようなkを用いて表すと次のようになります。

     \begin{eqnarray*} \displaystyle ma_{i} &=& \frac{1}{n}(0.5 \times x_{i-k}+x_{i-(k-1)}+ \cdots +x_{i-1}+x_{i}+x_{i+1}+ \cdots +x_{i+(k-1)}+0.5 \times x_{i+k}) \\ &=&\frac{1}{n}\left\{x_{i}+0.5 \times (x_{i-j}+x_{i+j})+\sum_{j=1}^{k-1} (x_{i-j}+x_{i+j})\right\} \end{eqnarray*}

移動平均は前後の項がないと計算することができないので、下表に示すようにデータの始めからk個分と終わりk個分の移動平均値は存在しません。

元データ 1 2 3 4 5 6 7 8 9 10
3項移動平均 - 2 3 4 5 6 7 8 9 -

■おすすめ書籍

基礎統計学の本ですが、一般的な基礎統計学の内容(推定、検定、回帰)に加えて時系列分析などについても網羅しています。





32. その他

統計検定バナー 「統計学の時間」では、記事を最後まで読むことで、統計検定2級に合格する力が身につくことを目標としています。