前提・実現したいこと
PythonのBeautifulSoupを使って、以下のHMTL内の
テスト1〜テスト4の文字列を全て取得したいのですが、うまくいきません。。。
for文の中に入らずスルーされてしまいます。
【取得イメージ】
テスト1
テスト2
テスト3
テスト4
ご教授お願いいたします。
該当のソースコード
以下が取得したいHTMLソースです。
html
1<div class="itemWords"> 2 <span class="glyphicon glyphicon-search"></span> 3 <a href="https://~~" title="アイウエオ">テスト1</a> 4 <a href="https://~~" title="アイウエオ">テスト2</a> 5 <a href="https://~~" title="アイウエオ">テスト3</a> 6 <a href="https://~~" title="アイウエオ">テスト4</a> 7</div>
以下が取得用pythonのソースです。
python
1html = driver.page_source 2soup = BeautifulSoup(html, "html.parser") 3driver.get("https://〜〜〜") 4for tag in soup.find_all('div', class_='itemWords'): 5 print(tag.text) 6
試したこと
print(tag.a.get("href"))
上記のように記載でurlの取得もやってみたのですが、うまく行かずです。。。
そもそもprintの処理まで来ていません。
補足情報(FW/ツールのバージョンなど)
python3.7
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/28 07:25
2020/03/28 07:27