##◆質問
とあるXML形式のRSSから、itemタグのrdf:about属性値をfind_all()メソッドを使ってリストで取得したいです。
##◆現状の問題点
find()で1つずつの属性値は取得できますがリストでの一括取得はできていません。
Python
1import requests 2from bs4 import BeautifulSoup as bs4 3 4urls = soup.find_all('item', rdf:about=True) # エラーになる 5url = soup.find('item').get('rdf:about') # find()で1つずつの属性値は取得できるがリストでの一括取得はできない 6titles = soup.find_all('title') 7dts = soup.find_all('dc:date')
RSSの構造は以下のとおりです。
XML
1<item rdf:about="【URLが入る】"> # ★rdf:about属性の値をリストで取得したい! 2 <title>【文字列が入る】</title> 3 <link>【URLが入る】</link> 4 <description>【文字列が入る】</description> 5 <dc:subject>【文字列が入る】</dc:subject> 6 <dc:date>【日付時刻が入る】</dc:date> 7</item> 8<item rdf:about="【URLが入る】"> # ★rdf:about属性の値をリストで取得したい! 9 (中略) 10</item> 11<item rdf:about="【URLが入る】"> # ★rdf:about属性の値をリストで取得したい! 12 (中略) 13</item>
##◆環境
・Windows 10
・Python 3.8.3
・Beautiful Soup使用
アドバイスをいただけましたら、幸いでございます。
どうぞよろしくお願い申し上げます。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/06/05 06:59 編集
2020/06/05 07:04
2020/06/05 07:54