ロジスティック回帰分析(1)
2017/08/14
カテゴリ:コラム「統計備忘録」
タグ:ロジスティック回帰分析, 統計備忘録
※コラム「統計備忘録」の記事一覧はこちら※
エクセル統計が誕生したのは1995年です。その翌年、朝倉書店から丹後俊郎氏らが書かれた「ロジスティック回帰分析」が出版されました。エクセル統計にロジスティック回帰分析が搭載されたのは、それから10年後の2006年になります。
今では、ロジスティック回帰分析を知らないと医学論文が読めないぐらい、メジャーな手法になりつつありますが、解説している書籍が少ないので、使用法に戸惑う人も多いようです。
ロジスティック回帰分析を使うと、いくつかの条件が重なったときに、あることが起こる確率を予測することができます。例えば、50歳の男性で、喫煙、飲酒を続けている人の肝硬変になる確率がどれくらいかといったようなことです。「タバコを吸う人は、吸わない人人の○○倍、発症リスクがある」といったようなコメントをよく目にしますが、多くは、ロジスティック回帰分析の結果によるものではないでしょうか。
医学分野で発展してきた手法ですが、応用範囲が広いので、ダイレクトメールによって商品が購入される確率を予想するとか、ある企業が倒産する可能性を評価するとか、色々な場面で使われるようになっています。
類似の手法としては判別分析がありますが、判別分析との違いとして、1つには、説明変数に量的尺度だけでなく名義尺度を混在させて分析できるというのがあります。また、判別分析では、群の違いがライオンとトラというように確定的であるものと見なしている(目的変数に誤差はないが、説明変数は誤差を持つ確率変数)のに対し、ロジスティック回帰分析では、病気の発症の有無というように、人によって同じ条件でも発症したりしなかったりとか、時間的に群が変化してしまう可能性があるケースにも適用できます(目的変数は誤差があってもよく、確率変数ではない説明変数でもよい)。
ロジスティック回帰分析を理解するには、対数と指数が分かること、ダミー変数への変換ルールを知っていること、重回帰分析とカイ二乗検定について一通りの知識があることが最低限必要かと思います。書籍では、このあたりの知識はあるものとして、ロジスティック変換やオッズ比の説明から始まり、結果の読み方、モデルの評価へと進んでいきます。