質問編集履歴

コードを追加しました

2022/04/19 03:04

投稿

スコア11

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,6 +1,3 @@
-pythonで名前空間付きXMLを操作する方法がいまいち理解できないのですが、例えば下記XMLの<<base:DocNumber>>の内容をすべて抽出(print)するにはどのようにすればいいでしょうか？
-やり方は色々あるかと思いますが、標準ライブラリのElementTreeを使用した方法で検討しています。
 ```XML
 <?xml version="1.0" encoding="utf-8" standalone="no"?>
 <!DOCTYPE business:PatentDocumentAndRelated SYSTEM "/DTDS/ExternalStandards/ipphdb-entities.dtd"[]>
@@ -33,3 +30,15 @@
 </business:PatentDocumentAndRelated>
 ```
+pythonで名前空間付きXMLを操作する方法がいまいち理解できないのですが、例えば上記XMLの<<base:DocNumber>>の内容をすべて抽出するにはどのようにすればいいでしょうか？
+下記コードではうまく取得できません。
+```python
+import xml.etree.ElementTree as ET
+tree = ET.parse('test2.xml')
+root = tree.getroot()
+for Priority in root.findall('{http://www.sipo.gov.cn/XMLSchema/business}Priority'):
+   DocNumber = Priority.find('{http://www.sipo.gov.cn/XMLSchema/base}DocNumber')
+   print(DocNumber.text)
+```