質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Q&A

解決済

1回答

489閲覧

各IDにつき一行化したい

msttkch

総合スコア9

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

1グッド

0クリップ

投稿2021/05/19 04:30

下の表を一人一行化したいのですが、苦戦しております。

ID=1の人:B02/B03に1、それ以外は0
ID=2の人:A01/B02に1、それ以外は0
となっていますが、これを列名を維持しつつIDごとに一行化するのがゴールです。なお、各セルに出現するは0と1のみで、同じIDであれば、同じ列には1は最大1箇所までです。また、IDにより行数(出現回数)が異なります。A/Bの添字は01〜99までとなっております。

この程度の数ですと例えばdplyrのgroup_byとmutateでごり押しできますが、実際の列数(A/Bに相当する箇所)が数百あるためfor loopやapply系など一通り試しましたが、力不足で今のところ解決できておりません。お知恵を拝借できると大変にありがたいです。よろしくお願いいたします。

使用環境:R (4.03)

現在の表の構成

|ID|A01|A02|A03|B01|B02|B03|
|:--|:--:|--:|
|1|0|0|0|0|0|0|
|1|0|0|0|0|1|0|
|1|0|0|0|0|0|0|
|1|0|0|0|0|0|1|
|1|0|0|0|0|0|0|
|1|0|0|0|0|0|0|
|2|1|0|0|0|0|0|
|2|0|0|0|0|0|0|
|2|0|0|0|0|1|0|

作りたい表

|ID|A01|A02|A03|B01|B02|B03|
|:--|:--:|--:|
|1|0|0|0|0|1|1|
|2|1|0|0|0|1|0|

cuttlefish44👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

KojiDoi

2021/05/19 04:34

「dplyrのgroup_byとmutateでごり押しできます」が数が多いと「力不足」ということですが、これは実現はできるが処理速度などの点で問題があるということですか?
msttkch

2021/05/19 04:41

ありがとうございます。大量のコピーアンドペースト(+それぞれの箇所のマイナーな変更)が必要となるので、手間の問題とミスが起きないかという観点からとなります。 例えば、 dat<- dplyr::group_by(ID)%>% dplyr::mutate(a01 = ifelse(sum(A01)>=1, 1, 0) の2行目の処理をひたすら繰り返すことになりそうですので。
guest

回答1

0

ベストアンサー

処理速度的な点での問題ではないとのことでしたので、dplyrsummarize_all などいかがでしょうか。

d <- structure(list(ID = c(1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L), A01 = c(0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L), A02 = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), A03 = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), B01 = c(0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L), B02 = c(0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 1L), B03 = c(0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L)), row.names = c(NA, -9L), class = c("tbl_df", "tbl", "data.frame")) d %>% group_by(ID) %>% summarize_all(sum) #   ID A01 A02 A03 B01 B02 B03 # * <int> <int> <int> <int> <int> <int> <int> # 1 1 0 0 0 0 1 1 # 2 2 1 0 0 0 1 0

投稿2021/05/19 08:51

cuttlefish44

総合スコア85

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

msttkch

2021/05/19 23:27

ありがとうございます。望んでいた通りのものができました! summarise系はあまり使ってこなかった(意義がよくわからなかった)のですが、うまくハマると大変に有用であることが実感できました。 重ね重ね、ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問