koji94122016/07/20 08:35保存したhtmlファイルに記載されているリンク先を保存したいという認識でよいでしょうか。 そのリンク先のURLはあらかじめ予測できるのか、それともhtmlを開くまでわからないものどちらになるでしょうか。 また、後者の場合、単体でURLを開くことは出来るか(クッキーやパラメータを送っていないか)という点もあわせて教えていただけますと助かります。 ただし、指定したURLのファイルの更にリンク先を保存するというのはwgetだけでは無理なのではと思っております。
dlrowolleh2016/07/21 12:09情報を追記しました。 一言でまとめますと、 よろしくお願いいたします。 DataListHyou.php?MstCode=01234567&Time=2016062912 がほしい です。 DataListHyou.php?MstCode=01234567&Time=2016062912 はPHPなのか、 リンク先なのかということですが、 当方Webページの仕組みがよく分からないため そのあたりもご教授いただけましたら大変幸いです。 何卒よろしくお願いいたします。
dlrowolleh2016/07/21 12:11誤字があったため、修正いたします。 一言でまとめますと、 DataListHyou.php?MstCode=01234567&Time=2016062912 がほしい です。 DataListHyou.php?MstCode=01234567&Time=2016062912 はPHPなのか、 リンク先なのかということですが、 当方Webページの仕組みがよく分からないため そのあたりもご教授いただけましたら大変幸いです。 何卒よろしくお願いいたします。
dlrowolleh2016/06/22 06:40-K_O- さん はじめまして。 素早くお答えいただきましてありがとうございます。 とても助かりました。 早速実行してみました。 すると、 1_吉田 ディレクトリの中に、コマンド実行時の年_月_日:.htmlディレクトリ 2016_06_22_15:.html が作成され、 2016_06_22_15:.html ディレクトリの中に、 Webブラウザで表示した時の※※.comのデータであると思われる DataList.php?MstCode=01234567 DataListHyou.php?MstCode=01234567&Time=2016062215 DataListTitle.php?MstCode=01234567&Time=2016062215 が入っていました。 取得するデータを DataListHyou.php?MstCode=01234567&Time=2016062215 だけにし、尚且つ、 1_吉田 ディレクトリの中に、 コマンド実行時の年_月_日:.htmlディレクトリ 2016_06_22_15:.html を作成しないしないようにするにはどうしたらいいでしょうか。 また、 DataListHyou.php?MstCode=01234567&Time=2016062215 の Time=2016062215 の部分はウェブページ表示中の年月日を表しているようなので DataListHyou.php?MstCode=01234567&Time=2016062215 の DataListHyou. 以降は任意の文字列何でも良い としたいと思っています。 更にこれを一行で済ませようとしたいです。 コマンドはどのようになりますでしょうか? これらを利用して、 1_吉田 |--DataListHyou.php?MstCode=01234567&Time=2016062215 |--DataListHyou.php?MstCode=01234567&Time=2016062216 |--DataListHyou.php?MstCode=01234567&Time=2016062217 ---DataListHyou.php?MstCode=01234567&Time=2016062218 のようにしたいです。 長文大変失礼しました。 何卒よろしくお願いします。
koji94122016/06/23 06:42Oオプションを使えば、指定のファイル名で保存することができ、 ndオプションでは念のためディレクトリを作成しないオプションをつけております。 こちらでいかがでしょうか。 wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com
dlrowolleh2016/06/29 05:16-K_O- さん 度々コメントいただきありがとうございます。 早速、 wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com を実行しました。 うまく、/home/yosida/Desktop/html/1_吉田/の中に※※.comの htmlファイルを取得し、保存することが出来ました。 ありがとうございました。 2016_06_29_14:.htmlを早速確認しましたところ、 どうやら私が勘違いして 支離滅裂な質問をしていたみたいです。 私が欲しいデータの DataListHyou.php?MstCode=01234567&Time=2016062218 の中身ではありませんでした。 2016_06_29_14:.htmlのリンク先の DataListHyou.php?MstCode=01234567&Time=2016062217 を取得したいです。 さらに DataListHyou.php?MstCode=01234567&Time=2016062217 の DataListHyou.php?MstCode=01234567&Time= 以降の10コの数字は年月日を表現しています。 なので任意の文字列として扱え、*が使えるのではないかと自分では考えております。 要するに、Webブラウザで※※.comと入力した時に表示される時のデータ の中の DataListHyou.php?MstCode=01234567&Time=”任意の文字列” を wgetコマンド1行で /home/yosida/Desktop/html/1_吉田/に保存するにはどうすればのでしょうか という質問になると思ったのですが、 それは可能でしょうか? ちなみに、 wget -nd -O /home/yosida/Desktop/html/1_吉田/$(date '+%Y_%m_%d_%H:').html http://※※.com で実行した際に取得でき、保存した2016_06_29_14:.htmlの中身ですが、 1 <html> 2 <head> 3 <META http-equiv="Content-Type" content="text/html; charset=EUC-JP"> 4 <title>ホームページ</title> 5 </head> 6 <frameset rows="180,*" cols="*" frameBorder="0"> 7 <frame name="Titke" src="DataListTitle.php?MstCode=01234567&Time=2016062912" scrolling="no"> 8 <frame name="Hyou" src="DataListHyou.php?MstCode=01234567&Time=2016062912" scrolling="yes"> 9 </frameset> 10 <noframes></noframes> 11 </html> 私の質問、実現したいことがコロコロと変わり、何度も質問してしまって大変申し訳無いのですが、 どのようにコマンドを変更すればいいでしょうか? よろしくお願いいたします。