質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

1回答

1899閲覧

表示を遅らせるページをスクレイピングする方法はありますでしょうか

退会済みユーザー

退会済みユーザー

総合スコア0

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2018/05/18 09:04

編集2018/05/18 09:05

##わからないこと
いつもお世話になっております。
この度、下記のサイトをスクレイピングしようとしているのですが、表示を送らせているためか、取得できておりません。

https://www.e-aidem.com/aps/list.htm?L=BMSList&PL=10&GMC=M02%3aM04%3aM12%3aM19%3aM20%3aM21&AC=01&ECD=01&SA=BCD%2cval88%2c_OPF2%2c_OPF%2cRUCD&NOI=20&P=1&SCD_=GG

Phantomjsを用いて読み込ませようとしているのですが・・・
コードは下記のようになっております。

php

1public function handle() 2{ 3 // インスタンスの生成 4 $dom = new \DOMDocument(); 5 $areas = [ 6 '01', 7 ]; 8 foreach($areas as $area) { 9 $url = '"https://www.e-aidem.com/aps/list.htm?L=BMSList&PL=10&GMC=M02%3aM04%3aM12%3aM19%3aM20%3aM21&AC='.$area.'&ECD='.$area.'&SA=BCD%2cval88%2c_OPF2%2c_OPF%2cRUCD&NOI=50&P=1&SCD_=GG"'; 10 // 整形したxmlの取得 11 $xml = $this->phantomjsHtml($url); 12 dd($xml); 13} 14public function phantomjsHtml($url) { 15 // インスタンスの生成 16 $tidy = new \Tidy; 17 $arr = []; 18 // 文字列にてhtmを出力 19 exec('C:\X_DRIVE\asp\home\laravel\vendor\bin\phantomjs.exe C:\X_DRIVE\asp\home\laravel\public\js\crawler.js '.$url, $arr); 20 if(!$arr){ 21 \statusFailure(); 22 } 23 // 文字列結合 24 $html = ''; 25 foreach($arr as $parts){ 26 $html .= $parts; 27 } 28 // エラー文字の削除 29 $fileContent = str_replace('&', '&', $html); 30 $config = array( 31 // 'drop-empty-elements' => false, // 空の要素を削除しない 32 // 'hide-comments' => true, // コメントを削除 33 'output-xhtml' => true, // xhtml に変換 34 ); 35 36 37 $tidy->parseString($fileContent, $config, 'utf8'); 38 $tidy->cleanRepair(); 39 40 $xml = simplexml_load_string($tidy); 41 return $xml; 42 } 43}

javascript

1var page = require('webpage').create(); 2var system = require('system'); 3var args = system.args; 4 5var url = args[1]; 6if (url == undefined) { 7 phantom.exit(); 8} 9 10page.open(url, function(status) { 11 if (status === 'success') { 12 page.switchToFrame(0); 13 var body = page.evaluate(function() { 14 return '<html>' + document.getElementsByTagName('html')[0].innerHTML + '</html>'; 15 }); 16 console.log(body); 17 } 18 phantom.exit(); 19}); 20

ご助力いただけますと幸いです。
何卒よろしくお願い申し上げます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

自己解決しました
javascriptファイルを下記のように修正した結果、表示させることができました。
処理を遅延させてページを表示させたい方がいましたら、こちらを使えるかもしれません。

var page = require('webpage').create(); var system = require('system'); var args = system.args; var url = args[1]; if (url == undefined) { phantom.exit(); } page.open(url, function(status) { var html = page.evaluate(function () { return document.documentElement.outerHTML; }); console.log(html); phantom.exit(); });

投稿2018/05/18 09:58

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問