バイアスとの付き合い方
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 「 誤差の問題」の記事で、誤差には系統誤差と確率誤差の2種類があると書きましたが、バイアスはこのうちの系統誤差に含まれます。 バイアスとは、データ収集の方法によってデータが真の分布から一定の方向へずれてしまう(系統的なずれがある)ことを指します。人間を対象にした実験や調査では頻繁に...
錯誤相関
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 先日、バイアスについて調べ物をしていたところ、Wikipedia上で「錯誤相関」なる用語と遭遇しました。忘れないうちに備忘録にメモしておきます。 錯誤相関(英語ではillusory correlation)とは、相関があると思い込んでしまうこと、錯覚による相関です。例えば、あなたが、初めての旅行先で道に迷って...
よくある間違い
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 今回は、統計初心者のよくある間違いや勘違いを取り上げます。 1.p値が小さいほど差が大きい 平均値の差を検定する場合、p 値を左右するものには、「平均値の差の大きさ」以外に、「標準偏差」と「サンプルサイズ(n)」があります。同じ平均値の差なら標準偏差が小さい方が p 値も小さくなります。また...
統計記号†
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 「統計記号 †」を検索していて、統計WEBにたどり着かれる方がいらっしゃいますが、統計WEBのどこにも記述がなかったので、今回、コラムに書いておきます。 † や †† の符号は検定結果の表中に 用いられていることがまれにあります。 † は短剣符(dagger、ダガー)と呼ばれ、パソコンに「だがー」と入力して...
P=0.05だったら
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 清水信博氏の『もう悩まない!論文が書ける統計 』の中の1節に、「 P = 0.05 だったらどうする」という1節があり、中々面白い話題なので紹介したいと思います。 ここに出てくる P とは、もちろん、統計ソフトを使って統計的仮説検定を行うと出力される P 値のことです。検定を行うときは、P が...
t分布か正規分布か―平均値の差の検定
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 平均値の差の検定を行うには、t 分布を用いる方法( t 検定)と正規分布を用いる方法( z 検定)とがあります。どう使い分けたらよいのでしょう。結論から先に言うと、迷わず t 検定を使ってください。 平均値の差の検定をするには、検定統計量として「平均値の差/標準誤差」を求めます。こ...
正規分布の発見─統計学史(4)
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 今年はガウス(Johann Carl Friedrich Gauss、1777-1855)が『天体運行論』を出版してからちょうど200年になります。多くの統計学の本では、ガウスが正規分布を発見したと書かれています。ガウスが『天体運行論』の中で、天体観測によるデータの誤差はある基本的な法則に従うという理論を確立したからです。...
mの分布―標本平均と中心極限定理
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 統計学のテキストでは母集団の平均を母平均といってギリシャ文字の μ(ミュー)で表します。一方、母集団から抽出した標本集団の平均を標本平均といってアルファベットの小文字の m や X(エックスバー)で表します。 推測統計学(統計的仮説検定や推定のこと)の立場では母平均は1個しか存在しません...
バーに入ってきたビル・ゲイツ
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 平均値が集団の平均的姿を表さない典型例に平均年収があります。これを分かりやすくした話が「バーに入ってきたビル・ゲイツ」です。 「バーに入ってきたビル・ゲイツ」とは、「とあるバーにビル・ゲイツが入ってきたらバーの客の平均年収は急激に上がるけれど、ビル・ゲイツが入ってくる前からいた客が以前...
変数の分類
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ Wikipediaによると、変数の尺度を名義、順序、間隔、比例の4つに分けようと提案したのはスタンレー・スティーブンズ(Stanley Smith Stevens)。1946年にサイエンス誌に発表された"On the theory of scales of measurement"という論文でとのことです。 尺度の違いは当サイトの統計用語集でも読んでいただ...