数時間に一度更新されるサイトのスクレイピングを行っているのですが、サイトにキャッシュが有効になっておらず困っております。
クライアントからキャッシュを要求できるヘッダーなどはありますか?
指定した期日までアクセスしないタイプのキャッシュではなく、Etagを使ったキャッシュを使用したいです、よろしくお願いいたします。
なぜキャッシュが有効にならないと困るのでしょうか。スクレイピングする立場からは、キャシュが無効の方が常に最新のデータがとれるように思えますが。サーバーに負荷をかけたくないのでしょうか。であれば、アクセスする頻度を少なくすればよいのではないでしょうか。
サーバー側でそもそもキャッシュ機能を使ってない場合も多く、その場合はキャッシュを要求しようがありません。
負荷をかけたくないと考えつつも頻度は落としたくないので、キャッシュを有効にしたいです。
Webエンジニアではないので有益な情報か判断つかないのですが、サーバーはApacheを使用しているようです。
$$$$$$
回答2件
あなたの回答
tips
プレビュー