よくある間違い
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
今回は、統計初心者のよくある間違いや勘違いを取り上げます。
1.p値が小さいほど差が大きい
平均値の差を検定する場合、p 値を左右するものには、「平均値の差の大きさ」以外に、「標準偏差」と「サンプルサイズ(n)」があります。同じ平均値の差なら標準偏差が小さい方が p 値も小さくなります。また、サンプルサイズが大きくなるほど p 値は小さくなります。理論的には、僅かでも差があれば nをどんどん大きくしていくことで有意差を検出することができます。従って、p 値が小さいほど差が大きいと言えるのは、標準偏差と n が等しい場合だけです。これらは中心極限定理によるものです。
なお、よく似た間違いに、「p 値が小さいので強い相関がある」というのもあります。
2.両側検定と片側検定の有意な方を採用する
両側検定と片側検定では、帰無仮説は同じですが対立仮説が異なります。どちらの結果を採用するかは研究計画の段階で決めておきます。両側検定と片側検定の違いが分からない人は、とりあえず両側検定の結果を採用しましょう。
なお、最初から片側検定をするつもりでも、p 値だけで有意判定をするのは危険です。対立仮説と逆の分布になっている可能性があります。
3.母数とは分母の事だ
母数と分母はまったく別物です。母数とは母平均や母標準偏差など母集団の分布を特徴付ける値のことです。英語でparameterと言います。
4.相関関係と因果関係は同じことだ
x と y の2つの変数の間で有意な相関が見られたとしても、y が x の影響を受けているかどうかは断定できません。x と y を入れ替えても相関係数は一緒です。x と y の間に因果関係は無くて、ともに第3の変数の影響を受けていたのかもしれません。
因果関係を確実に証明するには実験を組みます。実験が無理な場合には時系列的変化を追うなどして、どちらが先行しているかを調べます。
この他にも、「バラツキが無いデータを分析し、結果が出ないのはソフトの所為だと決め付ける」、「ノンパラメトリック検定は t 検定よりも劣る」、「多重比較は分散分析の結果が有意だったときのみ有効」、「複数回答のクロス集計表に対してカイ二乗検定を行う」など数々あります。もっともひどい誤りに「検定の結果は絶対だ」というのがありますが、今日のところは、このあたりで終わりにしておきます。