前提・実現したいこと
スクレイピングを勉強していて、robots.txtという存在を知りました。
robots.txt 例
User-agent:msnbot User-agent:bingbot Disallow: /
上記の場合、User-agentがmsnbot, bingbotはすべてのクロールを禁止するという意味だと思うのですが、
msnbotがスクレイピングをしようとするとエラーが返ってきて、
ここに記載されていないUser-agentは許可になるのでしょうか?
あと、User-agentについて調べてもよくわからなかったのですが、
pythonでのスクレイピングはどのUser-agentとして扱われますか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/03/18 05:07