前提・実現したいこと
pyhonでリストに入れたURLの特定の文字列だけを抽出したい。
発生している問題・エラーメッセージ
pythonを初めて3ヶ月めです。youtubeやネットで見たものをなんとなく理解することができるのですが、ちょっと要件が変わるとどうしていいかわからなくなります。
指定したURL一つだけの特定の文字列を取得するところまではいけたのですが
下記のコードの
url="https://ena-kagu.com/product.php?id=215"
をリストにし、複数URLをいれてスクレイピングできるようにしたいです。
ただ単に、↓のようにしてもできないようで手が止まってしまっています。。
url= [ "https://ena-kagu.com/product.php?id=215" "https://ena-kagu.com/product.php?id=216" "https://ena-kagu.com/product.php?id=217" ]
該当のソースコード
python
1import re 2import requests 3from bs4 import BeautifulSoup 4 5 6headers = {"User-Agent": "Mozilla/5.0 (X11; Linux x86_64; rv:61.0) Gecko/20100101 Firefox/61.0"} 7url="https://ena-kagu.com/product.php?id=215" 8response = requests.get(url=url, headers=headers) 9html = response.content 10soup = BeautifulSoup(html, "lxml") 11 12 13#ここで「商品管理番号」内のテキストを全取得 14all_text=soup.find(class_="pro-description").text 15 16 17#ここで取得したテキストを1行ずつ分割してリストに収納 18all_text_list=all_text.split("\n") 19 20 21 22for text in all_text_list: 23 if "商品管理番号" in text: 24 print(text)
補足情報(FW/ツールのバージョンなど)
jupyter labを使用しています。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/09/16 15:25
2021/09/17 01:30
2021/09/17 03:16