前提・実現したいこと
PythonのBeautifulSoupを使って、以下のHMTL内の
テスト1〜テスト4の文字列を全て取得したいのですが、
以下のように一つの文字列として取得されてしまいます。。。
['テスト1テスト2テスト3テスト4']
以下のように4つの文字列として取得したいです。
【取得イメージ】
['テスト1','テスト2','テスト3','テスト4']
ご教授お願いいたします。
該当のソースコード
以下が取得したいHTMLソースです。
html
1<div class="itemWords"> 2 <span class="glyphicon glyphicon-search"></span> 3 <a href="https://~~" title="アイウエオ">テスト1</a> 4 <a href="https://~~" title="アイウエオ">テスト2</a> 5 <a href="https://~~" title="アイウエオ">テスト3</a> 6 <a href="https://~~" title="アイウエオ">テスト4</a> 7</div>
以下が取得用pythonのソースです。
python
1driver.get("https://~~") 2html = driver.page_source 3soup = BeautifulSoup(html, "html.parser") 4lists = [] 5for tag in soup.find_all('div', class_='itemWords'): 6 print(tag.text) 7 lists.append(tag.text) 8 9print(lists)
試したこと
以下のように取得すると最初の文字列しか取得できません。。。。
['テスト1']
python
1driver.get("https://~~") 2html = driver.page_source 3soup = BeautifulSoup(html, "html.parser") 4lists = [] 5for tag in soup.find_all('div', class_='itemWords'): 6 print(tag.a.text) 7 lists.append(tag.a.text) 8 9print(lists)
補足情報(FW/ツールのバージョンなど)
python3.7
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/28 08:03