質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
bash

bash(Bourne-again-Shell)は sh(Bourne Shell)のインプリメンテーションに様々な機能が追加されたシェルです。LinuxやMac OS XではBashはデフォルトで導入されています。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

2回答

4242閲覧

javascript適用後のソースコードの入手

zacky

総合スコア59

bash

bash(Bourne-again-Shell)は sh(Bourne Shell)のインプリメンテーションに様々な機能が追加されたシェルです。LinuxやMac OS XではBashはデフォルトで導入されています。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

1クリップ

投稿2015/10/30 11:15

あるサイトのダウンロードリンクをクロールして自動取得することを考えています。

wget を使用してHTML ファイルを取得したところ、 JavaScript が使用されていたサイトであった為、JavaScript適用前のソースコードが手に入り、ブラウザで確認できる表示の物とは異なりました。

このような場合、 JavaScript を実行した結果を取得する方法はあるのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

phantomjsを使用すれば可能です。

以下は、入力したURLを開いて、3秒待った状態のhtmlを標準出力します。
URLはangularjsを用いたシングルページアプリケーションです。

bash

1phantomjs scrape.js http://edgy.black/ > scraped.html

javascript

1//scrape.js 2 3// Dependencies 4var system= require('system'); 5var webpage= require('webpage'); 6 7// Environment 8var url= system.args[1]; 9 10// Setup webpage 11var delay= 3000;//ms 12var page= webpage.create(); 13page.open(url,function(status){ 14 setTimeout(function(){ 15 var html= page.evaluate(function(){ 16 return document.documentElement.outerHTML; 17 }); 18 19 system.stdout.write(html); 20 phantom.exit(0); 21 },delay); 22});

投稿2015/10/30 11:37

編集2015/10/30 11:40
horse_n_deer

総合スコア452

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

基本的にはありません。
ただし、JavaScript ファイルも合わせて取得し、自分のサーバー内でJavaScriptを実行し、パースした結果を取得することになります。
昨今では、nodejsといった**サーバーサイド JavaScript **との組み合わせで実現可能でしょう。

現に、Google は1、2年前からJavaScript で実行されない限り取得できなかったコンテンツをリスティングしているので、技術的には可能だと思います。

投稿2015/10/30 11:22

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問