ノンパラメトリックのデータについて2群(男女)の比較を行いたいと思っております。
縦断研究で2群(男女)のデータを取りました。
csvデータをRStudioに取り込みました。
データはdfに格納しました。
データを下記に示します。
ID Gender Grade tonsil
1 1 Male 2 11.100
2 2 Male 2 9.900
3 3 Female 2 18.328
..........
100 206 Female 4 14.578
101 207 Female 4 36.869
102 209 Male 4 99.263
103 200 Male 4 71.199
........
250 511 Male 6 20.826
251 513 Male 6 69.097
252 514 Female 6 88.655
253 517 Female 6 61.498
254 519 Female 6 85.226
となります。
データは正規分布ではないので、ノンパラメトリックでの検定を考えています。
パラメトリックな場合でしたら、二元配置分散分析を考えたのですが、残念ながらできません。
そこで、色々調べてみたら、下記の論文が見つかりました。
この論文は題名に記されているように、縦断研究のノンパラメトリックに有用でRを用いたものでした。
ここで、nparLDパッケージをインストールして
nparLD- An R Software Package for the Nonparametric Analysis of Longitudinal Data in Factorial Experiments.pdf
の論文に従って、交互作用を検証しようと思います。
ex.f1f1np <- nparLD(tonsil ~ Gender * Grade, data = df, subject = df$ID, description = FALSE)
を入力した際にエラーが出ました。
[.data.frame
(data, , subject) でエラー: undefined columns selected
上記のように出たのですが、よくわかりません。
そこで、エラーを突き止めたいと思い、RStudioの中でエラー箇所の部分について、Inspect Elementから中をのぞきました。
その内容を下記に示します。
<span class="GGBOEFPDKVB ace_constant"> [.data.frame
(data, , subject) でエラー: undefined columns selected
</span>
と、なっていました。
もしかしたら、的外れなことを記載しているかもしれません。
そして、提示した論文に関してもデータを抜き出して試してみたかったのですが、データの所在がありませんでした。
dfのデータ形式としては、IDは文字列型にGradeとGenderに関しては因子型としています。
どの様に修正をしたら良いのでしょうか?
どんな些細なことで良いので、ご助言いただければ大変助かります。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー