#### 現象
あるテキストデータの書き出しを行おうとした際に以下のエラーが出力されます。
python
1#ファイル書き込み 2with open("text.txt", 'wt') as f: 3 f.write(data)
error
1UnicodeEncodeError Traceback (most recent call last) 2<ipython-input-98-63a7acf2db25> in <module> 3 1 #ファイル書き込み 4 2 with open("text.txt", 'wt') as f: 5----> 3 f.write(data) 6 4 7 5 #ファイル読み込み 8 9UnicodeEncodeError: 'cp932' codec can't encode character '\xb7' in position 2415: illegal multibyte sequence 10
####試したこと
該当のテキストデータから'\xb7'を削除する
python
1data = data.replace('\xb7','') 2with open("text.txt", 'wt') as f: 3 f.write(data)
error
1UnicodeEncodeError Traceback (most recent call last) 2<ipython-input-104-63a7acf2db25> in <module> 3 1 #ファイル書き込み 4 2 with open("text.txt", 'wt') as f: 5----> 3 f.write(data) 6 4 7 5 #ファイル読み込み 8 9UnicodeEncodeError: 'cp932' codec can't encode character '\u1d55' in position 3423: illegal multibyte sequence
次々とエンコードできないものが出てきてしまい・・・
replaceで一つ一つ消していく以外に一気に取り除く方法はないでしょうか?
python
1print(re.findall('\u1d55',data)) 2>>>['ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ']
回答1件
あなたの回答
tips
プレビュー