質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.33%

  • Windows

    1540questions

    Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

  • Webサイト

    1130questions

    一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

  • PowerShell

    405questions

    Windows PowerShellはコマンドラインインターフェースであり、システム管理を含むWindowsタスク自動化のためのスクリプト言語です。

  • Internet Explorer

    300questions

    Internet Explorer(IE;MSIE)はマイクロソフトが開発したウェブブラウザです。Microsoft Windowsに組み込まれています。

  • VBScript

    239questions

    VBScript(Visual Basic Scripting Edition)はMicrosftが開発したスクリプト言語であり、Visual Basicのサブセットです。

WEBページの保存を自動化する方法

受付中

回答 6

投稿

  • 評価
  • クリップ 0
  • VIEW 2,966

Aneks

score 94

とあるWEBページの保存をしたいと思っています。
理由は仕事のことなので明かせないのですが、早い話、サーバー移転等の都合により、現在の場所にWEBページを置けなくなってしまい、引っ越す必要が出てきました。
しかし、保存したいと考えているページは、今後はWEB上で公開しない方針のページです。しかし、職場内での希望によりページだけ残すことになりました。

自分なりにPythonとDBを連携させて、元のとおりに保存できるようにしようなど悪戦苦闘してみたのですが、本職ではないこともありうまくいかずに断念しました。
年度末には移転がされてしまうため、それまでにページの状態だけでも保存しようと思っているのですが、IE標準で搭載されている「ファイルを名前を付けて保存する」の場合ですと、1サイトあたり100ページ以上はあるため、相当な時間を使うことになります。人海戦術ができるだけの余力もありません。

そこで教えていただきたいのは、PowerShellなど言語は問わないので、WEBページの保存を自動化できるようなスクリプトやソフトウェアなどについてです。
自分なりに探してはみたのですが、うまく動作してくれなかったり、単一ページの自動保存だったりと思うようなものに出会えない状況です。
WEBサイト全体を自動的に保存してくれるようなスクリプトやソフトウェアはないでしょうか。

要件は、
・WEBサイトのページ保存を自動化できること
・ファイルの保存形式は問わないが、.mht又は.html、もしくはその両方が保存できること
・テキストデータから一覧を読み込んで順に取得するのではなく、同一URL内を自動で探索して順に保存してくれること
あたりができれば文句はありません。

なお、今時ありえない話ではあるのですが、そのWEBサイトにはCSVやテキストなどでWEBサイトの元データを出力させる機能がついておらず、管理者の方では予算も限られていることから、機能を追加することもできないそうです。
本来ならば、管理者の都合なので何とかしてもらいたいところですが、取り合っていただけませんでした。

どうか力を貸してください。

よろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 6

+2

人海戦術をオススメします。1ページ1分として1サイト100分です。
多分、知識をつけるよりもアプリを探すよりも早く、確実にダウンロードできます。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+1

こんにちは。

各種保存ツールがあるようです。
久しく使っていないので最近の性能は把握していませんが、昔は完璧なツールは存在していませんでした。WEB技術はどんどん進化しつつ多様化しているので状況はより悪くなっているかも知れません。
下手に自動化に頼るより、te2jiさんが言っているように人海戦術の方がより短時間で済むかも知れません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+1

なぜftpを使わないのかよくわかりませんが、なにか深い事情があるのでしょう。
生成された結果よりも、エンジンとデーターを引っ越した方がいいと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

静的なコンテンツだけなら

wget -r -l 0 http://~


で再帰的にゴリゴリ保存することを考えましたが。

・ファイルの保存形式は問わないが、.mht又は.html、もしくはその両方が保存できること

「mht」形式で保存は厳しいですね。
あと、動的なコンテンツとかも。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

ブラウザ「Firefox」の拡張機能「ScrapBook」とかどうですか。
ページ構成とかによって難があるかもしれませんが、
結構便利ですよ。

ただ、検証とかどうされるんですかね。
そう考えると人海戦術が一番かもしれません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

ええ?
これどうやってアップロードしたんですか?
名前を付けて保存だと、CGI や PHP などのサーバーサイドで動的に生成されるページが固定されてしまいますよね?

FTP でアップロードされたのであれば、その逆に FTP でダウンロードできるはずです。
そうでないなら、投稿などによって動的に構成されたページだと思いますので、HTTP でのダウンロードはお勧めしません。

自社サイトであれば、WordPress などでしたらバックアップ機能を使い、そうでなければ FTP でダウンロードするのが最適解だと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/02/13 18:48

    DB という単語が出ているところを見ると、おそらくはレンタルサーバーで、ひょっとしたら WordPress などですよね?
    であるならバックアップ機能がついていると思いますので、それを使って投稿を一括ダウンロードし、新サーバーにレストアするのが良いと思います。
    バックアップの仕方についてはそのサーバーの管理者にお尋ねいただければ、なんらかの回答があると思います。

    キャンセル

同じタグがついた質問を見る

  • Windows

    1540questions

    Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

  • Webサイト

    1130questions

    一つのドメイン上に存在するWebページの集合体をWebサイトと呼びます。

  • PowerShell

    405questions

    Windows PowerShellはコマンドラインインターフェースであり、システム管理を含むWindowsタスク自動化のためのスクリプト言語です。

  • Internet Explorer

    300questions

    Internet Explorer(IE;MSIE)はマイクロソフトが開発したウェブブラウザです。Microsoft Windowsに組み込まれています。

  • VBScript

    239questions

    VBScript(Visual Basic Scripting Edition)はMicrosftが開発したスクリプト言語であり、Visual Basicのサブセットです。