前提・実現したいこと
初めまして。xml初心者でして、pythonでxmlファイルから図書情報を取得することができず困ってしまったため、
質問させていただきました。
具体的には、下記のxmlファイルから、タイトルや画像を取得したいと考えています。(空想科学読本というタイトル)
どなた様か教えていただけたら幸いです。
下記は解析したいXMLファイル↓
xml
1<searchRetrieveResponse xmlns="http://www.loc.gov/zing/srw/"> 2<version>1.2</version> 3<numberOfRecords>1</numberOfRecords> 4<nextRecordPosition>0</nextRecordPosition> 5<extraResponseData> <facets> <lst name="REPOSITORY_NO"> <int name="R100000001">1</int> </lst> <lst name="NDC"> <int name="4">1</int> </lst> <lst name="ISSUED_DATE"> <int name="2006">1</int> </lst> <lst name="LIBRARY"> <int name="さいたま市立中央図書館">1</int> <int name="和歌山県立図書館">1</int> </lst> </facets> </extraResponseData> 6<records> 7<record> 8<recordSchema>info:srw/schema/1/dc-v1.1</recordSchema> 9<recordPacking>string</recordPacking> 10<recordData> <srw_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:srw_dc="info:srw/schema/1/dc-v1.1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="info:srw/schema/1/dc-v1.1 http://www.loc.gov/standards/sru/dc-schema.xsd"> <dc:title>空想科学読本</dc:title> <dc:creator>柳田 理科雄 著</dc:creator> <dc:subject>科学</dc:subject> <dc:subject>テレビドラマ</dc:subject> <dc:subject>アニメーション</dc:subject> <dc:description>新装版</dc:description> <dc:description>第17刷 2014.8</dc:description> <dc:publisher>KADOKAWA</dc:publisher> <dc:language>jpn</dc:language> </srw_dc:dc> </recordData> 11<recordPosition>1</recordPosition> 12</record> 13</records> 14</searchRetrieveResponse>
発生している問題・エラーメッセージ
①タグ名に不要な情報がついている。
下記でprintした結果、表示されるタグの前に、「{http://www.loc.gov/zing/srw/}」というURLがついてしまいます。
例){http://www.loc.gov/zing/srw/}version
python
1for child in root: 2 print(child.tag)
②上記のためか、child.iter("タグ名")でデータの抜き出しができない。
③上記問題も含めて考えたときに、図書タイトルや画像を取りたいときは、具体的にはどのようなコードで抜き出せますでしょうか?
該当のソースコード
python
1import xml.etree.ElementTree as ET 2 3# XMLデータの読み込み 4tree = ET.parse('/Users/user/Documents/python/kaien_library_project/librarypro/api_test/sru.xml') 5root = tree.getroot() 6 7for child in root: 8 print(child.tag, child.attrib)
どうぞ、よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2021/11/14 08:30 編集
2021/11/14 08:38
退会済みユーザー
2021/11/14 11:18