Python/BeautifulSoupでスクレイピングしようとしています。
以下のようなタグで、aaaもbbbもcccも取得したい場合はどのようにすればよろしいでしょうか。
HTML
1<div id="child1">aaa<span class="large">bbb</span>ccc</dd>
上のHTMLをスクレイピングしようとすると、bbbは取得できてもaaaやcccは取得できません。
Python
1from bs4 import BeautifulSoup 2 3#変数htmlに上記タグ含んだHTMLが入っているとして 4soup = BeautifulSoup(html, 'html.parser'); 5 6d1 = soup.select_one("#child1") 7d2 = soup.select_one("#child1 > .large") 8 9print("d1=" + d1) #TypeError: must be str, not Tag 10print("d2=" + d2) #OK
d1はエラーが出てしまいます。
どうすれば、aaaとcccを取得できるのでしょうか。
よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/01/02 10:12
2018/01/02 10:12