Python/Mysqlでの環境依存文字の扱い方

構成
下記のようなプログラムの流れになっています

cp932のcsvファイル

↓ 1.変換 ↓

utf8のcsvファイル

↓ 2.格納 ↓

utf8のDBでutf8のテーブル

↓ 3.人間の手によるUPDATE(自由入力なので環境依存文字も入力可能) ↓
↓ 4.出力 ↓

cp932のtsvファイル

質問
1.　上記3の「人間の手によるUPDATE」の箇所で①やⅡなどの環境依存文字を入力するとDBには格納されますが、上記4の出力の際にエラーが出ます。どうすればいいでしょうか？

Python
1UnicodeEncodeError: 'cp932' codec can't encode character '\u32b7' in position 393: illegal multibyte sequence

DBとテーブルがutf8なのがいけないのかと思い、sjisに変更してみましたが、同様のエラーが出ます。原因は何でしょうか？DBには①やⅡなどの環境依存文字は格納されている理由もわかりません。DBには環境依存文字とか言う概念はないんでしょうか？

2.　DBとテーブルはutf8にしていますが、特に理由はありません。csv/tsvファイルとの整合性を保つためにもsjisに変更して方がいいですか？

行動規範の内容に同意します

回答1件

cp932とは平たく言えばsjisのことです。つまり、utf8だから問題が出ているのではなく、sjisに変換しようとしてエラーが出ていると考えられます。コードがどうなっているのかわかりませんが、出力関係の設定をもう一度チェックしてみてはどうでしょうか。

投稿2018/11/16 03:50

総合スコア13727

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.30%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問