質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
WordPress

WordPressは、PHPで開発されているオープンソースのブログソフトウェアです。データベース管理システムにはMySQLを用いています。フリーのブログソフトウェアの中では最も人気が高く、PHPとHTMLを使って簡単にテンプレートをカスタマイズすることができます。

sh

shは、UNIX系OSのシェル操作の1つであり、最も基本的なシェルのことです。

Q&A

解決済

2回答

1591閲覧

wgetを利用してWordpressサイトを一括ダウンロードしたい

bananacoffee

総合スコア260

WordPress

WordPressは、PHPで開発されているオープンソースのブログソフトウェアです。データベース管理システムにはMySQLを用いています。フリーのブログソフトウェアの中では最も人気が高く、PHPとHTMLを使って簡単にテンプレートをカスタマイズすることができます。

sh

shは、UNIX系OSのシェル操作の1つであり、最も基本的なシェルのことです。

0グッド

0クリップ

投稿2021/03/03 08:35

Wordpress製の自サイトをクローズするにあたり、(LAMP環境でない)ローカルにてサイト内容を確認するために、Wgetを利用して一括ダウンロードしたのですが、ページや画像は正しくダウンロードできたものの、CSSやJavascriptが正しく読み込まれない状態です。

実行したコマンド

sh

1wget -np -p -E -k https://hoge.com/

ダウンロードされたアセット

  • /hoge.com/wp-content/themes/mytheme/style.css%3Fver=20201208.css
  • /hoge.com/wp-content/themes/mytheme/assets/js/common.js%3Fver=20190121

ダウンロードされたHTML(/hoge.com/index.html)内の記載

<link rel='stylesheet' id='mytheme-style-css' href='wp-content/themes/mytheme/style.css%3Fver=20201208.css' media='all' /> <script src='wp-includes/js/jquery/jquery.min.js%3Fver=3.5.1' id='jquery-core-js'></script>

これらのクエリストリングを人力で取り払って読み込めば正しく表示されることは確認したのですが、全ページに適用するのがなかなか面倒くさく、wgetコマンド内で解決できる方法はあるのでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

自己解決

結局自前のスクリプトで対応しました。

CHERRYさんの回答通りではありますが、望んだ回答は得られなかったため、申し訳ないですがベストアンサーなしとさせていただきます。

投稿2021/03/09 02:32

bananacoffee

総合スコア260

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

回答がつかないようなので...

市販のWebクローニングソフトウェアの場合、後処理として、プログラムでファイル名の調整をしているようですので、同じように シェルスクリプト等で処理するのが良いかもしれません。(%3Fver=数字 が含むファイル名を修正する等...)


別解としては...

ご自身の管理している WordPress のコンテンツを HTML で保存しておきたいということであれば...

WordPress から HTML/CSS な静的サイトとして書き出せるプラグインがありますので、それで WordPress サイトを静的サイトとして書き出すのがどうでしょうか?

メジャープラグインとしては、Simply Static かなと思います。

投稿2021/03/04 07:58

編集2021/03/04 07:58
CHERRY

総合スコア25171

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/03/04 09:08

>回答がつかないようなので という前置きをよく書かれているが、質問がなされてから何日も経過しているなら分からなくもないが、まだ24時間程度しか経ってない。 回答が無い質問なんて山ほどあるから余計な前置き無用で回答どうぞ。
bananacoffee

2021/03/05 01:04

ご回答ありがとうございます。 本のサイトについてはご提案の「別途変換スクリプトを作成(というかsedコマンド)」にてひとまずの対応をしております。 これだと総当り、ないしは対応表が必要になるのと、今度は余計な部分まで変換されていないか心配しているところです。 本サイトやWordpressに限らず、キャッシュ回避のためにcssやJS、画像にクエリストリングを付与することはままあるので、これらを回避するような方法がコマンドレベルであればいいなと思った次第です。 私の質問の仕方が本Wordpressサイト限定であるような書き方だったので申し訳ないです。 Wordpressだとデフォルトの機能を利用していればほぼ確実にCSSとJSにクエリストリングが付与されるので丁度いいダシにした、というところです。 また、プラグインについてですが、仮に後日復活することを想定した場合のサイトの現状維持という意味合いで今回は却下しております。 Wordpressを表に出さずに静的サイトとして運用する際には便利に利用しています。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問