質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

ggplot2

ggplot2は、統計解析向けのプログラミング言語及びその開発実行環境であるR言語のグラフィック作成用のライブラリです。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Q&A

解決済

1回答

1701閲覧

[R]Rの箱ひげグラフを条件別に出力する方法(aes(fill=●●)で色分けができない)

Kkeguri

総合スコア6

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

ggplot2

ggplot2は、統計解析向けのプログラミング言語及びその開発実行環境であるR言語のグラフィック作成用のライブラリです。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

0グッド

0クリップ

投稿2020/08/24 13:40

編集2020/08/25 01:15

前提・実現したいこと

https://www.trifields.jp/visualization-of-decision-tree-using-ggparty-in-r-3499
上記URLのサイトの中段の「回帰木」のコードを参考にして、目的変数を"henni"、説明変数をA~Iの9つの変数としてコードを書き換えております。
サイト内では最終的に”Type"別に箱ひげグラフが出力されておりますが、私が書き換えるとBが4のときが青、それ以外は全てグレーになってしまい、サイトのように色分け出来ませんでした。

おわかりになる方、アドバイスいただけますと有り難いです。

csvで取り込んでいますが、中身の一部を出力すると下記のような形です。

head(df)

henni A B C D E F G H I
1 0.5 1 2 2 1 3 2 2 1 1
2 2.2 1 2 2 1 3 2 2 1 1
3 1.0 1 2 2 1 3 2 2 1 1
4 1.9 1 2 2 1 3 2 2 1 1
5 2.0 1 2 2 1 3 2 2 1 1
6 1.2 1 2 2 1 3 2 2 1 1

A~Iは1,2,3,4の変数をとります。

発生している問題・エラーメッセージ

下記のソースコードでの出力結果を添付します。 6つ箱ひげグラフが出力されますが、Bが1,2,3の時すべてグレーになってしまいます。

該当のソースコード

R

1library(rpart) 2library(partykit) 3library(ggplot2) 4library(ggparty) 5 6df <- read.csv("test2.csv",header=T) 7 8head(df) 9 10rt <- rpart(henni ~ A + B + C + D + E + F + G + H + I, data = df ) 11#henniが目的変数 A+~が説明変数に何を指定するか) 12 13prt <- as.party(rt) 14g <- ggparty(prt, terminal_space = 0.5) 15g <- g + geom_edge(size = 1.5) 16g <- g + geom_edge_label(colour = "grey", size = 3) 17g <- g + geom_node_plot( 18+ gglist = list(geom_boxplot(aes(x="",y=henni,fill = A)),theme_bw(base_size =12)), 19+ scales = "fixed", 20+ id = "terminal", 21+ shared_axis_labels = TRUE, 22+ shared_legend = TRUE, 23+ legend_separator = TRUE, 24+ ) 25g <- g + geom_node_label( 26+ aes(col = splitvar), 27+ line_list = list(aes(label = paste("Node", id)), 28+ aes(label = splitvar)), 29+ line_gpar = list(list( 30+ size = 10, 31+ col = "black", 32+ fontface = "bold" 33+ ), 34+ list(size = 12)), 35+ ids = "inner" 36+ ) 37g <- g + geom_node_label( 38+ aes(label = paste0("Node ", id, ", N = ", nodesize)), 39+ fontface = "bold", 40+ ids = "terminal", 41+ size = 3, 42+ nudge_y = 0.01 43+ ) 44g <- g + theme(legend.position = "none") 45plot(g)

試したこと

https://qiita.com/besuboiu/items/bddd41cb8bd7dd9ef717
上記のサイトでは"condition"別に色分けできているため、参考に

  • gglist = list(geom_boxplot(aes(x="",y=henni,colore = X ,fill = A)),theme_bw(base_size =12)),

と修正しましたが、結果は変わらずでした。。。

イメージ説明

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

shimiken

2020/08/27 05:56

6つの箱ひげグラフをそれぞれ別の色にしたいということでしょうか?
Kkeguri

2020/08/31 23:17

ご返答が遅くなり申し訳ありません。 Bが1,2,3,4の4つに分類されているのですが、Bごとに4色に色分けしたいという意味です。 場合によっては、一つのグラフの枠中にBが1のもの、2のものなど、2つのグラフができると思われます。
guest

回答1

0

ベストアンサー

fill=A の部分を fill=B にすればBごとに色分けされます。
ただ、Bは数値なのでダメかもです。

R

1df <- read.csv("test2.csv",header=T) 2df$B <- as.factor(df$B) 3head(df)

このようにBをfactorに変換してから、fill=B にすればうまくいくと思います。

投稿2020/09/01 02:33

shimiken

総合スコア368

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Kkeguri

2020/09/01 11:30

factorに変換したできました。 まさにやりたかったことができました。 ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問