STDEVとSTDEVP―2つの標準偏差
2017/08/14
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
Excelのヘルプから標準偏差を計算する関数を調べると、6つもの関数が見つかります。
STDEV、DSTDEV、STDEVA、
STDEVP、DSTDEVP、STDEVPA
頭にDが付く2つの関数はデータベース関数、末尾にAが付くのは文字列や論理値を含むデータを計算するための関数です。したがって、この6つの関数はSTDEV系とSTDEVP系の2組に分けられます。
STDEV、STDEVPのそれぞれの説明によると、最初の1文だけが異なっていて、「標準偏差とは」から後ろは同じです。
STDEVの説明
「引数を標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します。標準偏差とは・・・」
STDEVPの説明
「引数を母集団全体であると見なして、母集団の標準偏差を返します。標準偏差とは・・・」
両者の違いは、引数(計算対象となるデータ)が「標本」か「母集団全体」なのかという点にあり、「標本」ならば「母集団の標準偏差の推定値」を、「母集団全体」ならば「母集団の標準偏差そのもの」を計算するということのようです。
母集団全体を調査することを全数調査もしくは悉皆(しっかい)調査といいます。例えば、ある小学校の6年生全員の身長であれば全数調査が可能です。STDEVPとは、このような全数調査によって得られたデータから真の標準偏差を計算するための関数です。
母集団が大きいときや、実験のように繰り返せば幾らでもデータがとれるときは、母集団全体を調べることが難しくなります。こうなると真の標準偏差は求められないので、母集団の部分集合である「標本」のデータを使って標準偏差を「推定」するしかありません。このとき使う関数がSTDEVになります。こちらの標準偏差の方が大きく、標本が小さくなるほど(データ個数が少なくなるほど)、このSTDEVPとSTDEVの差は大きくなります。
なお、当サイトの統計用語集ではSTDEVによって求められる標準偏差の推定値を「標本標準偏差」と表していますが、通常、論文や報告書に記述する場合、「標本」を省略して単に「標準偏差」とするのが一般的です。推測統計学(統計的推定や検定のこと)では、標本から得られたデータしか扱わないので使い分ける必要が無いのです。