CSVに記載されているデータに対して以下の処理を加えたいです。
以下のことを実装したいのですが、力不足でうまく行きません。
アドバイスを頂けないでしょうか。。。
【実装したいこと】
・先頭行にヘッダーとしてlabelとtext_aを追加
・1から順に全ての行の先頭に番号を振りたいです。
・正規表現によるノイズの削除
【出力結果】
label text_a 0 親愛的〜***?
のように1行しか出力されません。
import codecs file0 = "/Users/apple/Downloads/task_data.csv" f0 = codecs.open(file0, "r", "utf-8") list0 = f0.readlines() f0.close() print(len(list0)) file1 = "/Users/apple/Downloads/task_data.csv" f1 = codecs.open(file1, "w", "utf-8") f1.write("label\ttext_a\n") num_line = 0 for i in range(1,len(list0)): list1 = list0[i].replace("\n", "") list1 = list1.replace("\r", "") list1 = list1.replace("\t", "") # if the original csv file has "tab", ERNIE may return error... list1 = list1.replace("\v", "") # vertical tab list1 = list1.replace('"', '') if list1 != "": f1.write("%s\t%s\n" % (num_line, list1)) num_line += 1 f1.close()
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/24 15:56