前提・実現したいこと
https://www.trifields.jp/visualization-of-decision-tree-using-ggparty-in-r-3499
上記URLのサイトの中段の「回帰木」のコードを参考にして、目的変数を"henni"、説明変数をA~Iの9つの変数としてコードを書き換えております。
サイト内では最終的に”Type"別に箱ひげグラフが出力されておりますが、私が書き換えるとBが4のときが青、それ以外は全てグレーになってしまい、サイトのように色分け出来ませんでした。
おわかりになる方、アドバイスいただけますと有り難いです。
csvで取り込んでいますが、中身の一部を出力すると下記のような形です。
head(df)
henni A B C D E F G H I
1 0.5 1 2 2 1 3 2 2 1 1
2 2.2 1 2 2 1 3 2 2 1 1
3 1.0 1 2 2 1 3 2 2 1 1
4 1.9 1 2 2 1 3 2 2 1 1
5 2.0 1 2 2 1 3 2 2 1 1
6 1.2 1 2 2 1 3 2 2 1 1
A~Iは1,2,3,4の変数をとります。
発生している問題・エラーメッセージ
下記のソースコードでの出力結果を添付します。 6つ箱ひげグラフが出力されますが、Bが1,2,3の時すべてグレーになってしまいます。
該当のソースコード
R
1library(rpart) 2library(partykit) 3library(ggplot2) 4library(ggparty) 5 6df <- read.csv("test2.csv",header=T) 7 8head(df) 9 10rt <- rpart(henni ~ A + B + C + D + E + F + G + H + I, data = df ) 11#henniが目的変数 A+~が説明変数に何を指定するか) 12 13prt <- as.party(rt) 14g <- ggparty(prt, terminal_space = 0.5) 15g <- g + geom_edge(size = 1.5) 16g <- g + geom_edge_label(colour = "grey", size = 3) 17g <- g + geom_node_plot( 18+ gglist = list(geom_boxplot(aes(x="",y=henni,fill = A)),theme_bw(base_size =12)), 19+ scales = "fixed", 20+ id = "terminal", 21+ shared_axis_labels = TRUE, 22+ shared_legend = TRUE, 23+ legend_separator = TRUE, 24+ ) 25g <- g + geom_node_label( 26+ aes(col = splitvar), 27+ line_list = list(aes(label = paste("Node", id)), 28+ aes(label = splitvar)), 29+ line_gpar = list(list( 30+ size = 10, 31+ col = "black", 32+ fontface = "bold" 33+ ), 34+ list(size = 12)), 35+ ids = "inner" 36+ ) 37g <- g + geom_node_label( 38+ aes(label = paste0("Node ", id, ", N = ", nodesize)), 39+ fontface = "bold", 40+ ids = "terminal", 41+ size = 3, 42+ nudge_y = 0.01 43+ ) 44g <- g + theme(legend.position = "none") 45plot(g)
試したこと
https://qiita.com/besuboiu/items/bddd41cb8bd7dd9ef717
上記のサイトでは"condition"別に色分けできているため、参考に
- gglist = list(geom_boxplot(aes(x="",y=henni,colore = X ,fill = A)),theme_bw(base_size =12)),
と修正しましたが、結果は変わらずでした。。。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー