前提・実現したいこと
お世話になっております。
pythonでのwebスクレイピングで,htmlが
<div id="A"> <ul id="B"> <li> <a href="http:C"> ← </li> <li></li> ← <li></li> ← </ul> </div>となっており、上記の矢印(←)の<li></li>の部分すべてを取得したいのですが、<ul id="B"></ul>以下の子要素が取得できません。
python
1res = requests.get("webサイトのURL") 2res.raise_for_status() 3 4 5soup = bs4.BeautifulSoup(res.text,"lxml") 6 7elem = soup.select('#B') 8print("elem = {}".format(elem))
このプログラムを試したところ,結果が
elem = [<ul id="B"></ul>]
となってしまい,子要素である
<li>
<a href="http:C">
</li>
<li></li>
<li></li>
が取得できませんでした。
試したこと
プログラムの
elem = soup.select('#B')
の箇所を
elem = soup.find_all(id = 'B')
としてみたり、
elem = soup.select(#A)
としてみたり、
elem = soup.select(#B li a)
など試してみましたが、すべてダメでした。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/04/06 09:26