teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

d

2018/10/24 15:20

投稿

tiitoi
tiitoi

スコア21960

answer CHANGED
@@ -20,4 +20,18 @@
20
20
  soup = BeautifulSoup(s, "lxml")
21
21
  print(soup.link.next_sibling)
22
22
  # https://hogefuga.php
23
- ```
23
+ ```
24
+
25
+ ## 訂正
26
+
27
+ 質問を見てなかったのですが、RSS なのでパースするのは HTML ではなく、XML ですね。
28
+ その場合、パーサーはXML用のものを指定してください。
29
+
30
+ ```
31
+ from bs4 import BeautifulSoup
32
+
33
+ s = '<item><title>タイトル</title><link>https://hogefuga.php</link><description>hoge</description></item>'
34
+ soup = BeautifulSoup(s, "lxml-xml")
35
+ print(soup.link) # <link>https://hogefuga.php</link>
36
+ ```
37
+ [公式ドキュメント](https://www.crummy.com/software/BeautifulSoup/bs4/doc/) の Installing a parser の欄を参照してください。