質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

824閲覧

php-phantomjsで取得したhtmlをphpQueryでスクレイピングしたい

pftyuk

総合スコア52

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

1クリップ

投稿2019/02/20 15:42

前提・実現したいこと

php-phantomjsで取得したhtmlをphpQueryでスクレイピングしたいのですが
phpQueryでスクレイピングする際にエラーになってしまいます。

url先のjs実行後のhtmlが取得できていることは確認済みです。
こちらを参考に実装を行ったのですが、エラーの原因がわからなかったのでご教示頂けると幸いです。

発生している問題・エラーメッセージ

Parse error: syntax error, unexpected 'newDocument' (T_STRING), expecting variable (T_VARIABLE) or '$'

該当のソースコード

PHP

1<?php 2//phpqueryの読み込み 3require_once("phpQuery-onefile.php"); 4//PHP Phantomjsの読み込み 5require_once("vendor/autoload.php"); 6use JonnyW\PhantomJs\Client; 7//インスタンスの取得 8$client = Client::getInstance(); 9//リクエストとレスポンスオブジェクト作成 10$request = $client->getMessageFactory()->createRequest(); 11$response = $client->getMessageFactory()->createResponse(); 12//URLの指定と実行 13$url = '***'; 14$request->setUrl($url); 15$client->send($request, $response); 16//js実行後のhtmlの取得 17$html = $response->getContent(); 18//echo $html; 19//DOMDocumentにする 20$dom = new DOMDocument; 21@$dom->loadHTML($html); //$htmlになんらかのHTML的invalidがあるので、@をつける 22$dom->saveHTML(); 23//phpQueryでスクレイピングする 24$doc = new phpQuery::newDocument($dom);//ここでエラー 25echo $doc; 26 ?> 27

補足情報(FW/ツールのバージョンなど)

PHP 7.1.16

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2019/02/21 01:42

(スクレイピングの是非はともかく) URLから取得したものではなく、単なる静的html文字列をDOMDocumentに入れても同じでしょうか。またphpQueryのバージョンは幾つでしょうか。
guest

回答2

0

適当にぐぐって見つけた記事を信じないほうがいい。
Phantomはもう開発終了してるので使ってはいけない。
phpQueryも古すぎるので使ってはいけない。
元はもう10年も前。こんなのが使えるわけがない。
https://code.google.com/archive/p/phpquery/downloads
composerで使えるようにしてた人ももう使うなと書いてる。
https://github.com/electrolinux/phpquery

PhantomではなくHeadless Chrome
phpQueryではなくSymfony DomCrawlerを使う。
https://github.com/symfony/dom-crawler

投稿2019/02/21 02:19

kawax

総合スコア10377

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pftyuk

2019/02/21 12:26

ご回答頂きありがとうございます。 仰る通りですね。 大変勉強になります。ありがとうございます。
guest

0

ベストアンサー

php

1 2$doc = new phpQuery::newDocument($dom);//ここでエラー

new しちゃダメです。

投稿2019/02/21 01:52

m.ts10806

総合スコア80765

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pftyuk

2019/02/21 12:25

ご回答頂きありがとうございました。 newしちゃダメなんですね・・・。 期待通りの結果を得ることが出来ました。この度はありがとうございました!
m.ts10806

2019/02/21 12:49

newはインスタンス化するときだけです。 phpQuery自体は抽象クラスのようですのでそもそもインスタンス化できません。また、クラス名::メソッド名()のように静的に利用する場合はインスタンス化はしませんので。 このあたりはphpQueryの使い方というよりクラスの基礎なのでphpマニュアルを読んでおさえておいてください。
pftyuk

2019/02/21 12:55

phpマニュアル見てみます! ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問