質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2303閲覧

テキストからエンコードできない文字列を一括で削除する方法

CookieM

総合スコア7

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/05/30 09:26

#### 現象
あるテキストデータの書き出しを行おうとした際に以下のエラーが出力されます。

python

1#ファイル書き込み 2with open("text.txt", 'wt') as f: 3 f.write(data)

error

1UnicodeEncodeError Traceback (most recent call last) 2<ipython-input-98-63a7acf2db25> in <module> 3 1 #ファイル書き込み 4 2 with open("text.txt", 'wt') as f: 5----> 3 f.write(data) 6 4 7 5 #ファイル読み込み 8 9UnicodeEncodeError: 'cp932' codec can't encode character '\xb7' in position 2415: illegal multibyte sequence 10

####試したこと
該当のテキストデータから'\xb7'を削除する

python

1data = data.replace('\xb7','') 2with open("text.txt", 'wt') as f: 3 f.write(data)

error

1UnicodeEncodeError Traceback (most recent call last) 2<ipython-input-104-63a7acf2db25> in <module> 3 1 #ファイル書き込み 4 2 with open("text.txt", 'wt') as f: 5----> 3 f.write(data) 6 4 7 5 #ファイル読み込み 8 9UnicodeEncodeError: 'cp932' codec can't encode character '\u1d55' in position 3423: illegal multibyte sequence

次々とエンコードできないものが出てきてしまい・・・
replaceで一つ一つ消していく以外に一気に取り除く方法はないでしょうか?

python

1print(re.findall('\u1d55',data)) 2>>>['ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ', 'ᵕ']

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pepperleaf

2020/05/30 10:08

なぜ、エンコードできないデータがあるのでしょうか? まずは、そこからでは。
meg_

2020/05/30 10:57

"text.txt"の文字コードは何でしょうか?
guest

回答1

0

ベストアンサー

Python

1with open("text.txt", 'wt', encoding='UTF-8') as f: 2```UTF-8に指定してあげればいいのでは?

投稿2020/05/30 09:49

ForestSeo

総合スコア2722

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

CookieM

2020/05/31 02:53

いただいた内容で解決することができました。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問