ぼやかないつもりのメモ(ブログ Ver)

つぶやきとメモの記録。更新はぼちぼち。

多重ロジスティック回帰分析

オッズ比について質問が、多重ロジスティック回帰分析の説明まで膨らんできた。もう話だけで理解してもらうのは大変なので、手を動かしてもらうことにしようと思う。手元にはRとJMPがあるので、両方でやってみせ、みんなにはRで実際にやってみてもらうことにする。

JMPで多重ロジスティック回帰分析

以前、天才にお薦めしてもらっていた「入門 医療統計学―Evidenceを見出すために」にも手順は載っていたが、

  • データ*1を名義尺度に変換
  • 分析→モデルのあてはめ
  • Yに従属変数、モデル効果の構成に独立変数を入れ、モデルの実行
  • 赤い▽をクリックしてオッズ比にチェック

でできる。

Rで多重ロジスティック回帰分析

Rでの手順は、以前にやったことがあるので大丈夫かと思いきや、かなりうろ覚えだったので、いつものようにRによる統計処理Rによる保健医療データ解析演習を参考にした。

dat <- read.csv("hoge.csv") # データ読み込み
attach(dat)
y <- factor(y) # 名義尺度へ変換
x1 <- factor(x1)
x2 <- factor(x2)
res <- glm(y ~ x1 + x2, binomial)
summary(res)
exp(coef(res)) # オッズ比の計算

名義尺度への変換*2を行わずにやっても同じ結果が返ってきたのだが、最近はやらなくてもよくなったのだろうか?

*1:2009/02/05追記:従属変数が0、1で入っている場合。

*2:読み込んだデータの値はヘッダを除きすべて0と1。