Pythonであるサイトをスクレイピングしようとしているのですが、
値すら取得できないです。
import requests from bs4 import BeautifulSoup res = requests.get('http://bakusai.com/areatop/acode=7/') soup = BeautifulSoup(res.content, 'html.parser') for i in soup.find_all("dt"): for j in i.contents: print(j) コード
色々なサイトを見ても参考になりませんでした。
タグもaタグもdivタグも全く出力されません。
beautifulsoupが使えないってことなのでしょうか。
print(res.text) してみてください。403とでており、アクセスが弾かれています。試しにユーザーエージェントを設定したら別のページが表示されましたが、以前として対応してないブラウザといわれてしまいました。
ご回答ありがとうございます。スクレイピングできないという事なのでしょうか。
横入り失礼します。HedlessChromeを使うと潜り抜けられるかもしれません。クローラー対策の度合いによりますが、おそらくはじかれるでしょうね。
HedlessChromeを確認しました。ご回答いただき、ありがとうございました。設定が難しそうですね、そもそも動的なHPなのか、アク禁止なのかさえ分からない状態です。
回答1件
あなたの回答
tips
プレビュー