ぼやかないつもりのメモ(ブログ Ver)

つぶやきとメモの記録。更新はぼちぼち。

カテゴリカル変数の順序の変更

Rでカテゴリカル変数を用いた回帰分析を行うと、カテゴリカル変数の中でもっとも順序が小さいもの(変数の値のアルファベット順など)がリファレンスとされる。有名なirisデータのSepal.Lengthで考えると、値としては「setosa」、「versicolor」と「virginica」が入っているのだが、「setosa」がリファレンスとして使われることになる。どうしても別の値をリファレンスとして用いたい場合には、以下のような方法が使える。

Sepal.Length2 <- factor(Sepal.Length, levels=c('versicolor','virginica','setosa'))

上記のようにして同じ解析を行うと、「versicolor」をリファレンスとした解析を行うことができる。