PythonのBeautifulSoupで、属性値を取得するとき、「&」「<」「>」といった値を変換せずにそのまま取得するにはどうしたらよいでしょうか。
このようなhtmlがあったとして、
<link rel="prev" href="https://example.com/5?sort=true&order=desc">https://example.com/5?sort=true&order=desc
を取得したいのですが
以下のコードだと「&」が「&」に変換されて
https://example.com/5?sort=true&order=desc
となってしまいます。
Python
1html_doc = """ 2<link rel="prev" href="https://example.com/5?sort=true&order=desc"> 3""" 4soup = BeautifulSoup(html_doc, 'html.parser') 5href = soup.find('link', {"rel":'prev'}).get("href") 6print(href)
どうぞよろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー