質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

2回答

2327閲覧

2つのcsvの共通部分を新たなcsvに書き込む

cir

総合スコア19

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2016/11/14 02:40

編集2016/11/15 07:49

###前提・実現したいこと
【ソースコード訂正あり】
python3.5.1で2つのcsvの共通部分を新たなcsvに書き込みたいと思っています。
正規表現のserchを使って共通部分を取りだそうとしたのですができていません。

それぞれのcsvの中身は以下のようになっています。
●a.csv
melon,
banana,
apple,

●b.csv
apple,
orange,
lemon,

###発生している問題・エラーメッセージ

f3にnameのみ書かれており、共通部分を取り出せていない。

###該当のソースコード

python

1import csv 2import re 3 4f1 = open('a.csv', 'rt') 5reader1 = csv.reader(f1) 6next(reader1) 7 8f2 = open('b.csv', 'rt') 9reader2 = csv.reader(f2) 10 11f3 = open('c.csv','wt') 12writer = csv.writer(f3, lineterminator='\n') 13writer.writerow(['name']) 14 15for columns1 in reader1: 16 for columns2 in reader2: 17 name = re.search(columns1[0],columns2[0]) 18 if name: 19 writer.writerow([name]) 20 21f1.close() 22f2.close() 23f3.close()

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

掲載されたコードはいくつか問題があります、おそらく期待した動作はしていないでしょう。

まず、csv.readerはイテレータ(ジェネレータ)なのでforの2重ループは2回目のループが上手くいかないはずです。
2重ループなどで繰り返し使う場合は、事前にlistでリストに変換してください。
詳しくはジェネレータを調べてみてください。

2点目、このケースならば正規表現を使うまでもありません、setで十分です。
多分、私が書くのであればこうします。

python

1import csv 2 3col1 = list(csv.reader(open('a.csv', 'rt'))) 4col2 = list(csv.reader(open('b.csv', 'rt'))) 5 6# 1行目はヘッダーなので捨てているのでしょうか? 7col1 = [x[0].strip() for x in col1[1:]] 8col2 = [x[0].strip() for x in col2[1:]] 9 10writer = csv.writer(open('c.csv','wt'), lineterminator='\n') 11writer.writerow(['name']) 12for name in set(col1) & set(col2): 13 writer.writerow([name])

私はコードは短くシンプルを目指しているので若干荒いですが、元コードはかなり丁寧にコードを書いていますね。
とても良いことだと思います。

できましたらwith構文などを使ったらもっと堅牢性が上がると思います。

投稿2017/05/29 07:44

編集2017/05/29 07:46
pashango2

総合スコア930

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

cir

2017/05/30 02:29

おっしゃる通り、1行目はヘッダーです。記載ミスでした。 2重ループにはリスト型の変換が必要なのですね。ジェネレータとsetについて後で調べておきます。 質問時はwith文で複数のファイルを開くことができないと勘違いしており、利用しなかったのですが、カンマ区切りで利用できるようなので、書き換えておきます。 pashango2さんのコードはシンプルですね。私も基本を抑えたら、シンプルなコードを目指したいと思います。回答ありがとうございます。理解が深まりました。
guest

0

ベストアンサー

下記の一致の摘出部分がおかしいかと思います。

b.csvのリードでEOFまで読んでしまうので、先頭に
リードポインタを戻さないと2回目のループができない。
のが原因のようです。ですのでラフに直すと下記で動くかと思います。

python

1import csv 2import re 3 4f1 = open("a.csv", "rt") 5reader1 = csv.reader(f1) 6 7f2 = open("b.csv", "rt") 8reader2 = csv.reader(f2) 9 10f3 = open("c.csv","wt") 11writer = csv.writer(f3, lineterminator="\n") 12writer.writerow(['name']) 13list = [] 14for columns2 in reader2: 15 list.append(columns2[0]) 16for columns1 in reader1: 17 for str in list: 18 print(str) 19 name = re.search(columns1[0],str) 20 if name: 21 writer.writerow([name.group(0)]) 22 23f1.close() 24f2.close() 25f3.close() 26

投稿2016/11/14 03:45

編集2016/11/15 14:39
nagaetty

総合スコア1106

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

cir

2016/11/14 04:47

確かにこの場合、クォーテーションマークは必要ありませんでした。ご指摘ありがとうございます。 しかし、クォーテーションマークをとってやってみてもf3にはnameしか表示されませんでした...
nagaetty

2016/11/14 06:13

columns1[0],columns2[0]の中身を表示してみるのが近道かと思います!
cir

2016/11/16 04:50

アドバイス通りcolumns1[0],columns2[0]の中身を表示して原因はわかったのですが、色々試しても解決方法がわからないままでした。 とても助かりました!回答ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問