質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

1回答

4833閲覧

Python3で日本語を使ったXMLファイルを読み込めない

coen

総合スコア10

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/10/16 01:04

最近、Python(Ver3.7)を始めました。
Pythonで、日本語を使ったXMLファイルを読み込めません。
XMLファイルの先頭1行目に、encoding="Shift_JIS" を記述しているとPython側で読み込むときにエラーが発生します。
どのような対処をしたら良いか教えてください。

発生している問題・エラーメッセージ

python test21.py

Traceback (most recent call last):
File "test21.py", line 4, in <module>
tree = ElementTree.parse(x)
File "C:\pg\Python37\lib\xml\etree\ElementTree.py", line 1197, in parse
tree.parse(source, parser)
File "C:\pg\Python37\lib\xml\etree\ElementTree.py", line 598, in parse
self._root = parser._parse_whole(source)
ValueError: multi-byte encodings are not supported

該当のソースコード

■Python # -*- coding: cp932 -*- from xml.etree import ElementTree x = 'fp4.xml' tree = ElementTree.parse(x) root = tree.getroot() print (root.tag) ■XMLファイル <?xml version="1.0" encoding="Shift_JIS"?> <root> <abc>1</abc> </root>

試したこと

XMLファイルの1行目を記述をなくすと正常終了します。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2018/10/16 03:34

日本語を扱いたいのであれば、utf-8 でもいいと思いますが、<?xml version="1.0" encoding="utf-8"?> とするのでは駄目なのでしょうか?
coen

2018/10/16 04:48

ありがとうございます。utf-8にするとタグの値が日本語のとき、エラーが発生します。”xml.etree.ElementTree.ParseError: not well-formed (invalid token)”
guest

回答1

0

「elementtree encoding」でググると、いくつか出てくるかと思います。
たとえば

投稿2018/10/16 01:15

t_obara

総合スコア5488

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

coen

2018/10/16 04:46

ありがとうございます。 ググってみたのですが、まだ解決できていません。 もう少し調べてみます。
t_obara

2018/10/16 05:10

「たとえば」のリンクにある変換をしても解決できていないのでしょうか?
coen

2018/10/16 05:33

「たとえば」のリンクの内容を、ソース及びXMLファイルをそのままコピーして実行したとき、   data = unicode(data, 'cp932') のステップで エラー:NameError: name 'unicode' is not defined が発生します。
coen

2018/10/16 05:43

”unicode を str に変換すればよい” というのもあったので、試してみましたが、エラーのままです。
t_obara

2018/10/16 07:39

python3系には(エラーメッセージの通り)unicode関数がありません。 3系でencode/decodeを利用して文字コード変換を行います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問