ぼやかないつもりのメモ(ブログ Ver)

つぶやきとメモの記録。更新はぼちぼち。

histとcut

hist(x, br, plot = FALSE)よりtable(cut(x, br))のほうがメモリを使わないらしいので下の方法で試してみた。(追記)やっぱり逆って話もある。どうやったら自分でチェックできるんだろう?

x <- rnorm(30)
hist(x, 5, plot = FALSE)
table(cut(x, 5))

すると5つの区間に含まれる個数が違うので、twitterで尋ねてみると、『@takeshou 例えばこれで同じになるはずです。hist(x, breaks=-3:2, plot = FALSE); table(cut(x, breaks=-3:2))』と教えてもらえた。breaksの値は、xをすべて含む範囲でないと怒られるがこれで一緒になった。たまたま5個に分けたときだけが問題なのかも知れないと思い、『hist(x, 10, plot = FALSE)』なども試してみたが、9個までしか区分けしてくれない。むむぅ、これはhistのデフォルトの区分け方に関係するのかな?