BellCurve 統計WEB

ブログ

Excelの分析ツール(1)

2017/08/26

カテゴリ:

※コラム「統計備忘録」の記事一覧はこちら


Microsoft Excelには、CORRELやTTESTといった様々な「関数」、「ピボットテーブル」、「分析ツール」や「ソルバー」などのアドインが用意されています。Excelだけでも、簡単な検定から、多大な手間は要するものの、かなり高度な多変量解析までこなせます。「相関係数を求めたい」とか「t検定をしたい」ぐらいで、わざわざ統計ソフトを買う必要はありません。Excelを利用して統計学を学ぶテキストも毎年のように出版されていますから、統計ソフトを買う前に一度読んでみてください。

ソルバーと分析ツールを組み込んだExcel2010(データのリボンの右端にボタンが表示される)


さて、前置きが長くなりましたが、今回はExcelの分析ツールを取り上げたいと思います。Excelが初期設定のままでは、メニューにもリボンにも分析ツールが表示されないので、分析ツールの存在を知らない人がほとんどではないかと思います。以前に、コラム「Excelで重回帰分析(1)」で分析ツールを使用して重回帰分析を解いてみましたが、分析ツールには重回帰分析以外にも幾つかの統計解析機能が備わっています。

分析ツールのウィンドウと搭載されている解析手法

分散分析:一元配置
分散分析:繰り返しのある二元配置
分散分析:繰り返しのない二元配置
相関
共分散
基本統計量
指数平滑
F検定:2標本を使った分散の検定
フーリエ解析
ヒストグラム
移動平均
順位と百分位数
回帰分析
サンプリング
t検定:一対の標本による平均の検定
t検定:等分散を仮定した2標本による検定
t検定:分散が等しくないと仮定した2標本による検定
z検定:2標本による平均の検定



このリストを見て「エクセル統計買わずに済んだ」と後悔している方がいるかもしれませんね。そういった方のために、また、これから統計ソフトの購入を検討されている方のために、Excelの分析ツールの限界、統計ソフトとの違いなどについて書いておきます。

分散分析(3種)

まず、最初に並んでいる分散分析ですが、Excelの分散分析には多重比較の機能がありません。それから「繰り返しのある二元配置」の場合、繰り返しの数が不揃いな場合に対応していません。「エクセル統計の分散分析について」で書いたように要因計画の配置表に合わせた書式のデータしか分析できないため使い勝手を悪くしています。

相関、共分散

次に相関と共分散ですが、これは、共に複数の変数(複数列)のデータからすべての組み合わせで相関係数や共分散を求め、相関行列や分散共分散行列にまとめることができます。ただし、欠損値があるデータでは注意が必要です。分析ツールには欠損値を含むケースを行ごと分析対象から除く機能がありません。一般の統計ソフトの多くについている機能ですが、この機能が無いため、欠損値を含む場合は事前に分析対象からケースを除いておく必要があります。また、無相関の検定(相関係数の有意性の検定)もありません。

基本統計量

基本統計量は、複数の変数(複数列)のデータより、
平均、標準誤差、中央値、最頻値、分散、尖度、歪度、範囲、最小、最大、合計、標本数、
k番目に大きな値、k番目に小さな値、信頼区間

をまとめて計算できます。Excelには標準誤差を直接求める関数が無いので、計算式が分からない人は分析ツールを使用してください。
Excelの欠点として用語の間違いが多いということが挙げられます。それはここでも見られます。標本数に出力されているのはサンプルサイズ(データ数)です。また、「k番目に大きな値」の出力の見出しは「最大値(k)」となり、何を意味するのか分からなくなっています(「k番目に小さな値」は「最小値(k)」)。信頼区間の出力は平均から信頼限界までの幅を出力しているだけで、区間の上限や下限は出てきません。CONFIDENCE関数の値を貼り付けているだけです。