各IDにつき一行化したい

下の表を一人一行化したいのですが、苦戦しております。

ID=1の人：B02/B03に1、それ以外は0
ID=2の人：A01/B02に1、それ以外は0
となっていますが、これを列名を維持しつつIDごとに一行化するのがゴールです。なお、各セルに出現するは0と1のみで、同じIDであれば、同じ列には1は最大1箇所までです。また、IDにより行数（出現回数）が異なります。A/Bの添字は01〜99までとなっております。

この程度の数ですと例えばdplyrのgroup_byとmutateでごり押しできますが、実際の列数（A/Bに相当する箇所）が数百あるためfor loopやapply系など一通り試しましたが、力不足で今のところ解決できておりません。お知恵を拝借できると大変にありがたいです。よろしくお願いいたします。

使用環境：R (4.03)

現在の表の構成

|ID|A01|A02|A03|B01|B02|B03|
|:--|:--:|--:|
|1|0|0|0|0|0|0|
|1|0|0|0|0|1|0|
|1|0|0|0|0|0|0|
|1|0|0|0|0|0|1|
|1|0|0|0|0|0|0|
|1|0|0|0|0|0|0|
|2|1|0|0|0|0|0|
|2|0|0|0|0|0|0|
|2|0|0|0|0|1|0|

作りたい表

|ID|A01|A02|A03|B01|B02|B03|
|:--|:--:|--:|
|1|0|0|0|0|1|1|
|2|1|0|0|0|1|0|

KojiDoi

2021/05/19 04:34

「dplyrのgroup_byとmutateでごり押しできます」が数が多いと「力不足」ということですが、これは実現はできるが処理速度などの点で問題があるということですか？

msttkch

2021/05/19 04:41

ありがとうございます。大量のコピーアンドペースト（＋それぞれの箇所のマイナーな変更）が必要となるので、手間の問題とミスが起きないかという観点からとなります。例えば、 dat<- dplyr::group_by(ID)%>% dplyr::mutate(a01 = ifelse(sum(A01)>=1, 1, 0) の2行目の処理をひたすら繰り返すことになりそうですので。

行動規範の内容に同意します

回答1件

ベストアンサー

処理速度的な点での問題ではないとのことでしたので、dplyr の summarize_all などいかがでしょうか。

d <- structure(list(ID = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L), 
                    A01 = c(0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L), 
                    A02 = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), 
                    A03 = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), 
                    B01 = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), 
                    B02 = c(0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 1L), 
                    B03 = c(0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L)), 
               row.names = c(NA, -9L), class = c("tbl_df",  "tbl", "data.frame"))

d %>% 
  group_by(ID) %>% 
  summarize_all(sum)
  
# 　　ID   A01   A02   A03   B01   B02   B03
# * <int> <int> <int> <int> <int> <int> <int>
# 1     1     0     0     0     0     1     1
# 2     2     1     0     0     0     1     0