##スクレイプがうまくいかない…
URLが入力されたテキストファイル内のURLを読み込みスクレイプしたいです。
エラーもでなく、なにも値が返ってきません…。
このような場合は何から検証をすればいいでしょうか。。ご協力をお願いします。
textファイルの中身
https://m.tb.cn/h.3DTWNEq?sm=0ed820
python
1import urllib.request, urllib.error 2import requests 3import csv 4import time 5 6from bs4 import BeautifulSoup 7 8with open('url.txt') as f: 9 for line in f.readlines(): 10 target_url = line.strip() 11 print(target_url) 12 13 14 html = urllib.request.urlopen(target_url).read() 15 soup = BeautifulSoup(html, 'lxml') 16 17 imgage = soup.findAll('ul' , id='J_UlThumb') 18 19 for f in imgage: 20 for link in f.findAll('img'): 21 imgoutput = link.attrs['src'] 22 print(imgoutput) 23 24 with open('images.csv','a', encoding='cp932' ,newline='') as f: 25 writer = csv.writer(f) 26 writer.writerow([imgoutput]) 27 28 29
print(target_url) の部分は表示されますが、そのあと何も起きず終わってしまいます。
ちなみに、コードの内容はご理解できているのでしょうか?理解できているのであれば、各ステップで期待通りのデータが取得できているか(既存の回答通り)確認すればよろしいかと。もしご理解できていないのであれば、まずは内容の理解を進めつつ、各ステップで何が返却されるべきなのか、それが正しく期待した内容なのかを確認していくことをお勧めいただいます。ちなみに、読み込んだファイルにURLリストが入っているのだと思いますが、うまくいかない場合には一つのURLに限って確認を進めるべきです。(確認コードは必要最小限にする)
回答1件
あなたの回答
tips
プレビュー