wget についてです。
サイト内を取得したいと考えております
① http://www.*****.com/test/A0001.do?AAA=001001001
というサイト内に、
② http://www.****.com/test/B0001.do?AAA=001001001&clc=03&urt=0000&pan=1
というリンクがあります。
wgetで自動化し、②以下を取得したいと考えております。
②以下を -rで取得
wget --post-data "AAA=001001001&clc=03&urt=0000&pan=1" http://www.****.com/test/B0001.do? -r
にて取得も不可でした。
ただ、①以下
wget --post-data "AAA=001001001" http://www.*****.com/test/A0001.do? -r
にて取得すると
B0001.do以下を取得できますが、目的の階層までたどり着けません。
加えて、B0002~B0100.do の不要な部分を階層取得してしまします。
自身、サーブレット、Strutsの知識が乏しく、イメージとしては、wgetを利用して、①を踏んでから②をwgetし
postデータを渡さなければならないと考えておりますが、実施するとデータが表示できない旨のエラーと
名前を指定していない為、ファイル名称が、A0001.do@とpostを取得出来ていない状態でDLされてしまいます。
ご存じの方などいらっしゃいましたら、ご教授いただければ幸いです。
追加確認
大変申し訳ありません
そもそも
http://www.*****.com/test/A0001.do? →取得可能 ブラウザ閲覧も可能
http://www.****.com/test/B0001.do? →取得不可 エラーページへ ブラウザ閲覧不可 エラーページへ
http://www.*****.com/test/A0001.do?にあるリンク経由でhttp://www.****.com/test/B0001.do?は
ブラウザ閲覧可能
以上となります。
ある特定のページを経由してwgetなのでしょうか?
回答1件
あなたの回答
tips
プレビュー