クロス集計表から分析する(1)
2017/08/24
カテゴリ:コラム「統計備忘録」
タグ:統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
クロス集計表の分析というと、カイ二乗検定しか思い浮かばない人も多いかと思いますが、私が知っているだけでも、20種類を超える統計量や多変量解析があります。この統計WEBのメインページにも、2×2のクロス集計表から計算可能な各種の検定や統計量が全部で12個載っており、入力フォームの集計表の各セルに任意の数字を入れ、計算ボタンを押すと、計算結果が表示されます。
エクセル統計には、クロス集計表から分析するための機能が13個あります。上図の「集計表の作成と分析」メニューの「独立性の検定」以下のものです。各機能の使用目的について、ざっと説明しておきます。
独立性の検定
「独立性の検定」は、多くの方が「カイ二乗検定」として覚えてしまっているものです。「カイ二乗検定」とはカイ二乗分布を利用した検定手法の総称で、クロス集計表から2変数間に関連があるかどうかを検定する場合を独立性の検定と言います。帰無仮説が「2変数が独立している(関連が無いということ)」なので、独立性の検定といいます。ここでは、2変数間の関連性の強さの指標となるCremerのV、YuleのQ(2×2の場合のみ)も同時に出力します。
フィッシャーの直接確率
これも独立性の検定の一種ですが、カイ二乗分布による近似的な有意確率ではなく、すべての考えられうる組合せを数えて、その中で、観測された以上の差がつく組合せの比率を有意確率としたものです。サンプルサイズやクロス集計表のサイズが大きくなると、組合せが膨大になり計算が困難になるので、エクセル統計では2×2のクロス集計表で、かつ、桁あふれを起こさない場合にのみ利用できます。「正確確率」とも呼ばれるように、カイ二乗検定よりも正確な有意確率が求められます。
クロス集計表の残差分析
クロス集計表の独立性の検定を行い有意だったときに、続けて、セル単位の分析を行う場合に利用します。各セルの比率が、全体的な比率に比べて統計的に有意に大きい、または、小さいのかを検定できます。
リスク比・オッズ比
エクセル統計では2×2のクロス集計表からリスク比(相対リスク)とオッズ比の区間推定を行います。2変数間の因果関係を調べるときに用います。臨床試験やコホート研究など前向き研究のときはリスク比を用い、ケースコントロール研究など後ろ向き研究のときに用います。
コクラン・アーミテージ検定
k行2列で、かつ、kのカテゴリーに順序があるクロス集計表から検定を行います。喫煙本数が増えるにつれて肺がんの発生が増えるかどうか、薬の用量を増やすと治癒率が高まるかどうかなどを検定したい場合に用います。