2つのcsvファイルをidで対応させてmergeさせたい

前提・実現したいこと

2つのcsvファイルをidで対応させ、結合させたい

R, Rstudioを使い始めて１週間の初心者です。
id=1,2,3...で対応する２種類のcsvファイルを結合させたいと思っています。
それぞれのcsvファイルには異なる変数名が横に並んでいる形式です。
欠損値もあります（all =Tで対応）。
id（=人数）は片方のデータで１行（１ケース）多い状態です。

demo1 <-read.table(file = "data1.csv",

```
               header = TRUE)
```

demo2 <-read.table(file = "data2.csv",

```
               header = TRUE)
```

demomerged <-merge(demo1, demo2, by="id",

```
               all = T)
```

発生している問題・エラーメッセージ

fix.by(by.x, x) でエラー:  'by' は有効な列を指定しなければなりません

該当のソースコード

ソースコード　merge　left_join

試したこと

・様々無料Rサイト・R書籍にて確認、書籍中に書いてあるコードそのものを入力しているが、走らないので、原因と改善策を知りたい
・単純にmerge で試しているが、サイトによるとdplyrで使えるleft_joinの方が高速であるとある。なんか難しそうで、mergeで解決してから…と試行錯誤中

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

shimiken

2020/04/21 06:03

head(demo1) head(demo2) の結果を教えてください。

monaa

2020/04/21 06:32 編集

ご質問ありがとうございます！以下、コンソール画面に表示された結果を貼付けます。どうぞご確認よろしくお願いいたします。 > head(demo1) id.sex.age.hight.weight.DB.connection.license 1 1,m,45,170,81,t,t,l 2 2,f,50,160,55,n,t,s 3 3,f,43,158,61,n,n,s 4 4,m,39,180,86,n,t,l 5 5,m,51,178,95,t,t,l 6 6,f,49,149,54,n,t,l > head(demo2) id.marital.economic.電子 1 1,s,,t 2 2,m,350,n 3 3,m,600,t 4 4,s,900,t 5 5,s,,t 6 6,s,600,t ＊実際の画面上では、例えばdemo1ではDBの下部の場所あたりから1,m,45, ...が記述される現れ方になっています。

shimiken

2020/04/21 06:35

カラム名の部分のピリオドはカンマの間違いですか？

monaa

2020/04/21 06:37

ご確認ありがとうございます。カラム id.sex.age.hight.weight.DB.connection.license こちらはエクセルで作成したdemo1の表を「csv形式にして保存」、それをRに読み込ませたところ、確かにピリオドにて現れています。

shimiken

2020/04/21 06:44

demo1$id としたらどうなりますか？

monaa

2020/04/21 06:47

ご連絡ありがとうございます。以下の結果となりました。 > demo1$id [1] 1,m,45,170,81,t,t,l 2,f,50,160,55,n,t,s [3] 3,f,43,158,61,n,n,s 4,m,39,180,86,n,t,l [5] 5,m,51,178,95,t,t,l 6,f,49,149,54,n,t,l [7] 7,m,44,166,67,n,n,l 8,f,53,161,42,n,n,s [9] 9,f,33,172,60,t,t,s 10,m,37,178,59,n,t,l 10 Levels: 1,m,45,170,81,t,t,l ...

行動規範の内容に同意します

回答2件

それぞれのcsvファイルの先頭行の.を全文,に置き換えてください。エクセルからの変換でどうやればこんなことになるのか謎ですが、明らかに間違った変換が行われています。

質問にあるようなread.tableの使い方では正しくcsvファイルを読み込めません。read.tableのデフォルトの区切り文字はカンマではなく「ホワイトスペース」です。

demo1 <- read.table("data1.csv", header=T, sep=",")
あるいは
demo1 <- read.csv("data1.csv", header=T)

投稿2020/04/21 07:11

KojiDoi

総合スコア13697

monaa

2020/04/21 07:37

ご連絡ありがとうございます。もう一度元のエクセルデータに戻り、ファイル形式を変更してみました。これまでは、「CSV UTF-8(コンマ区切り)」で選択していましたが、「CSV(コンマ区切り)」に変更して保存し、教えていただいた上記のコマンドの入力で、コンソール画面に綺麗なデータフレームが表示がされました！どうもありがとうございます。また質問投稿の際には、アドバイスお願いできると幸いです。どうぞよろしくお願いします。

monaa

2020/04/21 07:48

＞read.tableのデフォルトの区切り文字はカンマではなく「ホワイトスペース」です。こちらについても今ちゃんと理解しました。重要なご指摘ありがとうございます！

行動規範の内容に同意します

ベストアンサー

R
1demo1 <-read.table(file = "data1.csv", header = TRUE)
2demo2 <-read.table(file = "data2.csv", header = TRUE)
3
4colnames(demo1)<- c("id","sex","age","hight","weight","DB","connection","license")
5colnames(demo2)<- c("id","marital","economic","電子")
6                    
7demomerged <-merge(demo1, demo2, by="id", all = T)

これでどうでしょう

投稿2020/04/21 06:57

shimiken

総合スコア368

monaa

2020/04/21 07:02

ご回答ありがとうございます。やってみたところ、以下エラーが出現しました。 colnamesとして全ての変数をベクトルとして()内に記述する作業を挟む必要があることが知れてひとつ賢くなりました。 > demo1 <-read.table(file = "data1.csv", header = TRUE) > demo2 <-read.table(file = "data2.csv", header = TRUE) > > colnames(demo1)<- c("id","sex","age","hight","weight","DB","connection","license") names(x) <- value でエラー: 'names' 属性 [8] はベクトル [1] の長さと同じでなければなりません > colnames(demo2)<- c("id","marital","economic","電子") names(x) <- value でエラー: 'names' 属性 [4] はベクトル [1] の長さと同じでなければなりません > > demomerged <-merge(demo1, demo2, by="id", all = T) fix.by(by.x, x) でエラー: 'by' は有効な列を指定しなければなりません

shimiken

2020/04/21 07:11

すみません。間違えました。

shimiken

2020/04/21 07:13

read.table を read.csv に変えてください。 colnames(demo1)<- c("id","sex","age","hight","weight","DB","connection","license") とかはしなくていいです。

monaa

2020/04/21 07:45

度々のアドバイスありがとうございます。上述のコマンドを改めて入力したところ、csvファイルの連結に成功しました。ただ日本語の変数名「電子」列が読み込めず、またエラーとなってしまったため、「elec」に変更したところ読み込めました。（これはまだ別の問題として調べていきます・・・）お二人の回答者さまのおかげで、無事解決できました。決定的なコマンドを列挙いただいたので、回答者さまをベストアンサーにさせて頂きました。また質問投稿の際には、アドバイスお願いできると幸いです。どうぞよろしくお願いします。＜成功したコマンド＞ demo1 <- read.table("data1.csv", header=T, sep=",") demo1 demo2 <- read.table("data2.csv", header=T, sep=",") demo2 colnames(demo1)<- c("id","sex","age","hight","weight","DB","connection","license") colnames(demo2)<- c("id","marital","economic","elec") demomerged <-merge(demo1, demo2, by="id", all = T) demomerged

行動規範の内容に同意します

あなたの回答