下記のURLをスクレイピングしようか検討中でスクレイピングして良いか確認したいです。
http://ke.kabupro.jp/
robots.txtを使用し下記のようなかたちで検索したのですがファイルが出ず確認できません。
検索した方法
http://ke.kabupro.jp/robots.txt
このような場合はどのように確認したらよいのでしょうか?
よろしくお願い致します。
試した検索エンジン
Edge,Chrome
PC
windows10
> スクレイピングして良いか
サイトの所有者・管理者に許可を得てない限り「良い」とは言えません。あなたの言う「良い」の意味がそういうこととは違うような気もしますが。
クローラを作って某図書館サイトにアクセスしたら、業務妨害とかで逮捕された事例もありますので、甘く見ない方が良さそうです。
ご指摘ありがとうございます。
もちろん注意事項は守らないといけないですが添付のurlの記事含め調べていると
スクレイピング自体は違法でない認識です。https://umano-ie.com/scraping-rules/
スクレイピングするにはサイトの所有者・管理者に連絡取って確認するしかないのでしょうか?
サイトの所有者・管理者の意思を確認する手段の1つがrobot.txtであると思ったのですが、ご教授ください。
まずは http://ke.kabupro.jp/ にそれ用の API がないか探す、見つからなければそのサイトの所有者・管理者に聞くということをやってください。
あなたの回答
tips
プレビュー