Rstudioのcld関数を用いて、tukeyHSD検定で得られた有意差に降順でアルファベットをつけたいです。

実現したいこと

Rstudioのcld関数を用いて、tukeyHSD検定で得られた有意差に降順でアルファベットをつけたいです。
ご教示をお願い致します。

前提

Rstudioのcld関数を用いて、有意なグループにアルファベットをつけようとすると、アルファベットの順序が狂ってしまいます（降順でも昇順でもありません）。
私は植物を研究で扱っております。
特定の時期において、供試した４品種の茎の数に有意差があります。

該当のソースコード

R
1library(multcomp)
2#変数df2に最高分げつ期のデータを指定
3df2= df1[df1$stage =="maximum_tillering",]
4df2
5#1元配置の分散分析
6SG_res1 = anova(lm(df2$tiller.numnber ~ df2$cultivar))
7summary(SG_res1)
8#tukey検定
9#データの整理をして、分散分析の結果をtuk1に入れる
10tuk1 = data.frame(x= factor(df2$cultivar),y= df2$tiller.numnber)
11TukeyHSD(aov(y ~ x,data = tuk1))
12#本来では品種の名前が入っていますが、今回は伏せています
13tuk1$x = factor(tuk1$x,levels = c("a","b",
14                                 "c", "d"))
15
16#アルファベットを表示
17tuk2=aov(y ~ x,data = tuk1)
18SG_res2 = glht(tuk2,linfct=mcp(x="Tukey"))
19summary(SG_res2)
20cld(SG_res2,decreasing = T)

試したこと

ラボ内の人から、Rのバージョンを下げるとアルファベットの順序が揃うらしいので、やってみましたがダメでした。
宜しくお願いします。

補足情報（FW/ツールのバージョンなど）

R4.3.1 （R4.2.2でも無理でした）

little_street

2023/11/29 01:38

4品種の内どの2品種の間にも有意差がある状況なら（decreasing=TRUE 指定では）「"d" "c" "b" "a"」という出力が期待されますが，実際にはどのようなアルファベットが出力されるのでしょうか。

galileo_toshi

2023/11/29 07:50

ご回答ありがとうございます。おっしゃる通り、どの２品種間にも有意差がある状況であれば、コンソールに「"d" "c" "b" "a"」の様に出力されます。しかしながら、アルファベットの上に記載されている品種名と対応しておりません。例えば、４品種の名前がa,b,c,dで、分げつ数が多い順にd,a,b,cだとします。本来であれば、コンソール上に a b c d #品種名 "b" "c" "d" "a" と出てきてほしいのですが、「"d" "c" "b" "a"」の順で出力されてしまいます。

little_street

2023/11/29 10:58

私の環境で検討した内容を回答欄に記載しました。

行動規範の内容に同意します

回答1件

ベストアンサー

例えば、４品種の名前がa,b,c,dで、分げつ数が多い順にd,a,b,cだとします。

同様の大小関係となるように値を設定（mango > apple > peach > melon）し多重比較してみましたが，私の環境「macOS(M1) 13.6.1, R 4.3.2, multcomp 1.4.25」でも同様の結果です（下記の記述例参照）。

multcomp のマニュアルの cld の部分に目を通しましたが値の大小関係と連動してアルファベットを設定する機能は読み取れませんでした。現在その機能には対応していないのかもしれません。

なお，下記の記述例の最後に記載のように値の大小関係に合わせて x のレベルを設定し多重比較すれば値の大小関係とアルファベットを対応させることはできるようです

R
1library(multcomp, quietly=TRUE)
2
3set.seed(7)
4N <- 10
5tuk1 <- data.frame(
6    x = factor(rep(c("apple", "peach", "melon", "mango"), rep(N, 4))),
7    y = c(as.integer(rnorm(N, 25, 2.5)), as.integer(rnorm(N, 20, 2.5)),
8          as.integer(rnorm(N, 15, 2.5)), as.integer(rnorm(N, 30, 2.5))))
9
10tuk1$x <- factor(tuk1$x, levels = c("apple", "peach", "melon", "mango"))
11tuk2 <- aov(y ~ x, data = tuk1)
12SG_res2 <- glht(tuk2, linfct = mcp(x="Tukey"))
13summary(SG_res2)
14## 
15##   Simultaneous Tests for General Linear Hypotheses
16## 
17## Multiple Comparisons of Means: Tukey Contrasts
18## 
19## 
20## Fit: aov(formula = y ~ x, data = tuk1)
21## 
22## Linear Hypotheses:
23##                    Estimate Std. Error t value Pr(>|t|)    
24## peach - apple == 0   -3.400      1.148  -2.962   0.0263 *  
25## melon - apple == 0   -9.400      1.148  -8.189   <0.001 ***
26## mango - apple == 0    4.400      1.148   3.833   0.0026 ** 
27## melon - peach == 0   -6.000      1.148  -5.227   <0.001 ***
28## mango - peach == 0    7.800      1.148   6.795   <0.001 ***
29## mango - melon == 0   13.800      1.148  12.021   <0.001 ***
30## ---
31## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
32## (Adjusted p values reported -- single-step method)
33cld(SG_res2, decreasing=TRUE)
34## apple peach melon mango 
35##   "d"   "c"   "b"   "a"
36
37tuk1$x <- factor(tuk1$x, levels = c("mango", "apple", "peach", "melon"))
38tuk2 <- aov(y ~ x, data = tuk1)
39SG_res2 <- glht(tuk2, linfct = mcp(x="Tukey"))
40cld(SG_res2, decreasing=TRUE)
41## mango apple peach melon 
42##   "d"   "c"   "b"   "a"

投稿2023/11/29 10:56

編集2023/11/30 00:25

little_street

総合スコア455

galileo_toshi

2023/12/03 08:08

丁寧なご回答ありがとうございます。やはり、値の大小と連動してアルファベットは設定してもらえないのですね。ご説明の通りにデータフレームの品種の序列を、降順に並び変えることによって対応しました。 #変数df2に特定時期のデータを指定 df2= df1[df1$stage =="tillering",] df2 #tukeyHSD検定 #データの整理をして、分散分析の結果をtuk1に入れる tuk1 = data.frame(x= factor(df2$cultivar),y= df2$tiller.numnber) TukeyHSD(aov(y ~ x,data = tuk1)) tuk1.g = tuk1 %>% #品種ごとにグループ分け group_by(x) %>% #品種ごとの平均値を計算 summarize(y = mean(y)) %>% #品種ごとの平均値が大きい順に序列を変更 arrange(desc(y)) #平均値が高い順にベクトルを作成 order_vector = as.character(tuk1.g$x) %>% as.vector() #元のデータフレームの序列を、平均値が高い順に変更 tuk1$x = factor(tuk1$x, levels = order_vector) #アルファベットを表示 tuk2=aov(y ~ x,data = tuk1) SG_res2 = glht(tuk2,linfct=mcp(x="Tukey")) summary(SG_res2) cld(SG_res2) ggplot(data = tuk1, aes(x = x, y = y)) + geom_boxplot() + theme(plot.margin = unit(c(0.5, 0.5, 0.5, 0.5),"cm"))

行動規範の内容に同意します