交互作用とは
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 私が「交絡」という言葉に初めてお目にかかったときのことですが、「交互作用」と勘違いしてしまった覚えがあります。でも、両者は別物です。英語にすれば、前者が confunding、後者が interaction ですね。今回は後者について書きます。 交互作用とは、2つ以上の要因が考えられるとき、要因が組み合わさっ...
層別分析とは
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 飲酒の量と肺がんの発症率は、今のところ直接関係が無いとされています。しかしながら、お酒をよく飲む人と、あまり飲まない人に分けて肺がんの発症率を調べると、お酒をよく飲む人の方が発症率が高くなる傾向があります。これは、お酒をよく飲む人に喫煙者が多いからと考えられます。そこで、調査対象者を、...
交絡因子とは
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 医学研究の本を読むと「交絡因子があれば、多変量解析を使って調整する」という記述をよく目にします。交絡因子とは、要因と結果の両方の変数と関連がある第3の変数のことです。交絡因子がある場合に、ある要因と結果の関係を単変量解析によって評価しようとすると、交絡因子バイアスが発生して正しい評価が...
単変量解析とは
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ エクセル統計のサポートをしていると、「単変量解析をするにはどうしたらよいのか」という問い合わせを受けることがあります。単変量解析が説明変数(=独立変数)が1つだけの解析という意味なら、ほとんどの場合は多変量解析のツールをそのまま使うことができます。多変量解析の入門書を読むと、説明変数が...
無相関の検定―相関係数の有意性を検定する
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 「幾つデータが必要か? - 相関係数の有意性検定」をアップして以来、「相関係数の有意性検定」を調べている方のアクセスが増えているので、Excelを利用した検定の方法についても書いておきます。 相関係数の有意性検定は、「母相関係数が 0 である」を帰無仮説としています。「母相関係数が 0 」とい...
幾つデータが必要か?―測定の信頼性によ...
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 昨年末から3回に亘って必要なサンプルサイズの計算式を紹介してきましたが、この式で求められた n だけデータを集めれば良いということではなく、多少上積みをしておきます。 通常、どんな測定方法を用いても、測定対象の真の値から幾らかのずれがあります(体重測定の結果や、テストの点数など思い浮かべ...
幾つデータが必要か?―相関係数の有意性...
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 相関係数の統計的有意性の検定は「無相関の検定」と呼ばれています。相関係数がゼロである(=無相関)ことを帰無仮説としていることからこの名前が付いています。この検定についても、必要なサンプルサイズ(n)をざっくり計算できます。式は次の通りです。 r は相関係数です。|r| は相関...
幾つデータが必要か?―比率の差の検定
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ 「幾つデータが必要か?」の記事で、2群の平均値の差の検定についてサンプルサイズ(n)を幾つにするか計算式を紹介しましたが、今回は比率の差の検定のときに n を幾つ以上にしたらよいかを求めてみましょう。 計算式は次の通りです。この式も、有意水準を5%としたときに、対立仮説が正しい(2群の比率...
幾つデータが必要か?―平均値の差の検定
2017/08/19
カテゴリ:コラム「統計備忘録」
※コラム「統計備忘録」の記事一覧はこちら※ t検定で有意差検定を行う場合、2群間で僅かでも差があるなら、データの個数をどんどん増やしさえすれば、理論的にはいつか有意になります。しかしながら、予算にも時間にも限りがありますし、動物実験でそんなことをしたら倫理的にも許されないですね。それでは幾つデータを採ればよいのでしょうか。 統計T...
平均値と中央値の違い
2017/08/19
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※ 最小値が2、最大値が12の33個のデータがあったとします。33個のデータを小さい方から順に1番から33番まで番号を振っておきます。一本の定規の上に、各データを、データが持っている値と定規の目盛りが一致するように積み上げたところをイメージしてください。 この定規(上図の黒い棒)の左...