python beautifulsoup について。
request.getでrssを取得したあと、beautifulsoupでパースすると、
もともと <link>xxxxxxxx</link> となっているところが、 </link>xxxxxxxx
となってしまうため、 link を抽出できなくて困っています。
具体的には下記のような感じです。
import requests
import bs4
r = requests.get('http://alfalfalfa.com/index.rdf')
soup = bs4.BeautifulSoup(r.text,"html.parser")
link = str(soup('link')[1].string)
上記だと、結果が None になってしまいます。
理由は上記にも書きましたが、 print(soup.text)でパース後のrssを見てみると、
パースの仕方が悪いのでしょうか。
ご教示のほど、何卒宜しくお願いします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/11/29 15:18