出生時に低体重児かそうでないかを予測したいのですが、この場合、予測したい変数、すなわち、従属変数がカテゴリ型データとなります。
そこで、低体重児を「1」、それ以外は「0」の2値データに変換して、数値として考えることにして、重回帰分析をしたいと思っています。この方法は正しいでしょうか?
正しいです。
本来、予測したい変数(従属変数)の値がカテゴリ型データのときには、次の2つの手法がよく使われます。
①判別分析(線形判別関数分析)
②ロジスティック回帰分析
質問にあるように、従属変数の値を0と1とで表現して、重回帰分析を行う方法は①と同じ結果を与えます。したがいまして、正しいです。
しかし、最近では②のロジスティック回帰分析のほうが使われる頻度は多くなってきています。また、医療の分野では完全に①よりも②を使うのが一般的です。この理由はロジスティック回帰を実施すると、予測だけでなく、オッズ比の算出ができるからです。
オッズ比は医療統計で頻繁に登場する統計量で、ある疾病にかかる危険度が何倍になるかということを示すものです。
IBM SPSS ロジスティック回帰入門では詳しくロジスティック回帰分析の概念とIBM SPSS Statisticsを使用したロジスティック回帰分析の方法を紹介します。