カテゴリカル変数の順序の変更
Rでカテゴリカル変数を用いた回帰分析を行うと、カテゴリカル変数の中でもっとも順序が小さいもの(変数の値のアルファベット順など)がリファレンスとされる。有名なirisデータのSepal.Lengthで考えると、値としては「setosa」、「versicolor」と「virginica」が入っているのだが、「setosa」がリファレンスとして使われることになる。どうしても別の値をリファレンスとして用いたい場合には、以下のような方法が使える。
Sepal.Length2 <- factor(Sepal.Length, levels=c('versicolor','virginica','setosa'))
上記のようにして同じ解析を行うと、「versicolor」をリファレンスとした解析を行うことができる。