最近Pythonを使ったスクレイピングの記事をよく見ます。
スクレイピング=グレーというイメージで今までやってきませんでしたが、試しにやって見たいです。
スクレイピングしたいサイトで以下を確認して行えば良いかなと思ったのですが、他に確認しなければいけないことなどありますか?
- 利用規約にスクレイピングを禁止してないことを確認
- robots.txtに
robots.txt:Allow:/
などが記載されてることを確認 - クローラーのUser-Agentに連絡先を明記する
以下の記事を参考にしています。
https://docs.pyq.jp/column/crawler.html
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。