スクレイピングに際し、下記のrobots.txtを読みましたが禁止している内容がわかりませんでした。
日本経済新聞のrobots.txt
http://www.nikkei.com/robots.txt
記載内容
User-agent: *
Disallow: /search/site/
下記から始まるURLがスクレイピング禁止になるという理解ですが、該当するページが見つかりません。
http://www.nikkei.com/search/site/
スクレイピングの前に、念のため禁止されているページを確認したいと考えています。
robots.txtから具体的に禁止されているページの一例を知る方法はありますでしょうか?
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/05/23 09:47