ぼやかないつもりのメモ(ブログ Ver)

つぶやきとメモの記録。更新はぼちぼち。

集計済みの表データからクラスカル・ワリス検定

一般に自分のデータの解析を行う場合、個票データとなっていることが多いと思うが、どうしてもすでに集計され表になっているデータを解析することもある。今回は、クラスカル・ワリス検定について「カテゴリカルデータ解析 (Rで学ぶデータサイエンス 1)」を調べたのでその結果をまとめておく。

# 表の作成
x <- matrix(c(298, 196, 86, 1723, 1471, 439, 318, 416, 197), byrow = TRUE, nc = 3)
# 疑似個票データの作成
colv <- rep(col(x), x)
rowv <- rep(row(x), x)
# 解析
kruskal.test(colv, rowv)

ちなみに教科書(とこのエントリ)で用いているデータはvcdライブラリ内のDanishWelfareのデータの、婚姻状況(Status)とアルコール消費量(Alcohol)となっている。この例では、アルコール消費量を順序カテゴリカル変数と仮定している。