前提・実現したいこと
PythonでBeautifulSoupを使ってWEBページ内の特定の文字を取得したいのですが、うまくいきません。
不要なHTMLソースまで取得できてしまいます。。。
ご教授いただければと思います。
発生している問題・エラーメッセージ
該当のソースコード
python
1#! /usr/bin/env python 2 3from selenium import webdriver 4from bs4 import BeautifulSoup 5 6driver = webdriver.Chrome("/test/test/chromedriver") 7try: 8 # ページにアクセス 9 driver.get('https://test/') 10 html = driver.page_source 11 soup = BeautifulSoup(html, "html.parser") 12 for shopList in soup.find_all('div', class_='shop'): 13 results = soup.find_all("div", class_="shop_name") 14 print(results) 15except Exception as e: 16 print("【取得エラー】")
上記のソースだと、結果は以下のようになるのですが、
この結果のうち、「取得したい文字」だけを取得したいです。
<div class="shop_name"> 取得したい文字<br/> <span class="en">test</span> </div>, <div class="shop_name"> 取得したい文字<br/> <span class="en">test</span> </div>, <div class="shop_name"> 取得したい文字<br/> <span class="en">test</span> </div>
補足情報(FW/ツールのバージョンなど)
python3.7
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/10/27 12:12