UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。
VimとはUnix / Linux 系のOSに標準搭載されているターミナル上で動くテキストエディタです。
文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。
Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。
Q&A
解決済
3回答
3885閲覧
総合スコア17
0グッド
0クリップ
投稿2016/06/30 09:43
0
以
上のように、ターミナル上の対話で バイト文字列で表示されてしまうのです。 デバッグが面倒で困っています。。 ターミナルの環境設定では、 UTF=8に設定されています。
python2系、 mac os el capitan を利用しています。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
2016/07/26 04:21
2016/07/26 05:40
回答3件
list関数がバイト文字列で出力されているだけなので、ターミナルの環境設定は関係ありません。
投稿2016/06/30 09:52
総合スコア6621
print xml で表示されませんか?
python1>>> xml="あいうえお" 2>>> list(xml) 3['\xe3', '\x81', '\x82', '\xe3', '\x81', '\x84', '\xe3', '\x81', '\x86', '\xe3', '\x81', '\x88', '\xe3', '\x81', '\x8a'] 4>>> print xml 5あいうえお
python
1>>> xml="あいうえお" 2>>> list(xml) 3['\xe3', '\x81', '\x82', '\xe3', '\x81', '\x84', '\xe3', '\x81', '\x86', '\xe3', '\x81', '\x88', '\xe3', '\x81', '\x8a'] 4>>> print xml 5あいうえお
投稿2016/06/30 11:40
総合スコア553
ベストアンサー
これは文字化けではありません。バイト列を配列に変換して表示しています。
>>> list("あいうえお") ['\xe3', '\x81', '\x82', '\xe3', '\x81', '\x84', '\xe3', '\x81', '\x86', '\xe3', '\x81', '\x88', '\xe3', '\x81', '\x8a']
元の xml がどのように生成されたデータかが不明なので細かいことはわかりませんが、Python でのマルチバイト文字の扱いについて調べてみると良いでしょう。 残念ながら私は Python にはあまり詳しくないので具体的な回答は難しいですが、Python 2 系と Python 3 系で扱いが変わっていた気がします。
xml
投稿2016/06/30 10:02
総合スコア1864
回答へのコメント
2016/06/30 11:27 編集
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.31%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
助けてください。ターミナル文字化けが対策を講じても治りません