テキストファイルの、カンマまでの文字列の重複を無くしたいです。
ここで扱うテキストファイルには、一行に(,******)のような文字列があり、カンマが必ず存在します。条件は以下の通りです。
0. 重複の有無にかかわらず、カンマ以前の文字列は削除、もしくは別ファイルの書き出し時に抽出しないものとします。
0. 重複があった場合は、一方の文字列全体を消去もしくは別ファイルの書き出し時に抽出しないものとします。
下記のような、一行の文字列全体の重複を抽出しないコードは完成できましたが、上記のような条件のコードは作ることができませんでした。どなたか、回答のほどよろしくお願い申し上げます。
python
1lines_seen = set() 2outfile = open("******.txt", "w") 3for line in open("*****.txt", "r"): 4 if line not in lines_seen: 5 outfile.write(line) 6 lines_seen.add(line) 7outfile.close()
回答1件
あなたの回答
tips
プレビュー