質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

812閲覧

特定の文字列が含まれる行を書き換えたい

tanimachi

総合スコア13

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/11/16 02:32

初めて質問させて頂きます。
pythonは1カ月ほど前から独学で始めました。
質問をする前に、きちんと勉強をするのが筋かとは思いますが、どうぞご助力頂けませんでしょうか…。質問内容に不備等あればご指摘頂ければ幸いです。

前提・実現したいこと

csvファイルを読み込み、特定の文字列(9ケタの数字)が含まれる行の内容を書き換えた上で、別のcsvファイルに出力したいと考えております。

作業手順として以下の通りをイメージしております。
①csvファイルを読み込む(仮にtest.csvとします)
|列1|列2|列3|列4|
|:--|:--:|:--:|
|立替金|2018/11/16|立替金精算|¥XXX|
|厚生費|2018/11/16|123456789経緯費申請|¥XXX|
|仮払金|2018/11/16|仮払申請234567890|¥XXX|

②列3に9ケタの文字列が含まれている場合、内容を9ケタの文字列のみに書き換える。
|列1|列2|列3|列4|
|:--|:--:|:--:|
|立替金|2018/11/16|立替金精算|¥XXX|
|厚生費|2018/11/16|123456789|¥XXX|
|仮払金|2018/11/16|234567890|¥XXX|

③②の内容を新しいcsvへ出力する(仮にresult.csvとします)。

発生している問題・エラーメッセージ

どのようなコードを書けば②が実現できるかが分からず困っております。
9ケタの数字の文字列は[0-9]{9}という正規表現で検索できるかと思いますが、これに該当した場合、行を書き換えるという表現の記載方法が分からず、皆様のお知恵をお借りしたいです。

該当のソースコード

python

1file=open("test.csv","r") 2out_file=("result.csv","w") 3out_file.write("列1,列2,列3,列4\n") 4file.readline() 5lines=file.readlines() 6for line in lines: 7 if "[0-9]{9}" in line: 8 line.replace "[0-9]{9}" #申し訳ありません、この周辺行が特に分かりません。 9 row="{},{},{},{}\n".format( 10 line[1], 11 line[2], 12 line[3], 13 line[4] 14 ) 15  out_file.write(row) 16file.close() 17out_file.close() 18

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

できるだけ元のソースを生かして書いてみました。適宜コメントを書いているので参考にしてください。
また、正規表現については[python]正規表現 - コンパイル、マッチング、マッチした部分の取り出しなどを参考にしてください。

Python

1import re 2r = re.compile('.*([0-9]{9}).*') # 任意の文字列(9桁の数字)任意の文字列 3 4file = open("test.csv","r") 5out_file = open("result.csv","w") # openが抜けてました 6out_file.write("列1,列2,列3,列4\n") 7 8file.readline() # 見出し行を飛ばす 9lines=file.readlines() 10for line in lines: 11 cols = line.rstrip().split(',') # 末尾改行を取り除き、行データを列毎に分割します 12 13 # 3列目から9桁の数字列があれば抽出 14 m = r.search( cols[2]) 15 if m: 16 cols[2] = m.group(1) 17 18 row="{},{},{},{}\n".format( cols[0],cols[1],cols[2],cols[3]) # 書き込む行データはこのように作成することができます。 19 out_file.write(row) # 書き込みはループ内で行う必要があります 20file.close() 21out_file.close()

投稿2018/11/16 03:02

can110

総合スコア38234

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tanimachi

2018/11/16 04:00

can110様 早々にご回答頂きありがとうございます!頂戴したコードで希望した作業が完了できました。また正規表現についても参考リンクご教授頂き恐縮です。頂戴したコードを読み込み、勉強を進めたいと思います。この度は本当にありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問