＜R＞　重複列の削除を条件づけて行う　（ex. IDが重複しているが、テストの点数が高い方を採用する

平素より大変お世話になっております。
R言語で重複列の削除を条件づけて行う方法はございますか？

具体的には、下記のようなデータフレームがあるとします。
このなかでID=8,9,12は重複しているのですが、scoreの高い方のみを採用したいと思っています。
なお、scoreだけで考えるとID=9は両方同じなので、その場合はtreat Bを採用する　ような考えです。

distinctで重複を削除するかと考えたのですがその場合は条件指定ができないのか　と思い質問させていただきました。

もしご存知の方がおられましたらよろしくお願いいたします。

R
1x <- data.frame(
2  ID=c(1:12,12,9,8),
3  treat = c("A", "A", "A", "A", "A","B", "B", "B", "B", "B","C", "C", "C", "C", "C"),
4  score= as.integer(rnorm(15, mean = 10, sd = 4)))
5
6x %>% group_by(ID) %>% filter(n()>1) %>% arrange(ID)

行動規範の内容に同意します

回答1件

ベストアンサー

group_byを利用すればIDごとの最大scoreを求めることが出来るので、これに基づき、元データフレームからID,最大scoreに合致するものを普通に抽出すればいいのでは。

ソース例追記:

x %>% group_by(ID) %>% summarize(max_score=max(score)) -> x2
x[x$score==x2[x$ID,"max_score"],]

投稿2020/09/17 14:46

編集2020/09/18 08:38

KojiDoi

総合スコア13692

mourinho384

2020/09/18 05:27

ありがとうございます。初学者で、なかなか考えが及ばず申し訳ありません。 x %>% group_by(ID) %>% filter(n()>1) %>% arrange(ID) %>% summarise(score=max(score)) -> a で新規にtibbleを作成したのですが「ID,最大scoreに合致するものを元のデータフレームから抽出」がわからず困っています。どうかご教授いただけないでしょうか。

行動規範の内容に同意します