質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.92%

PHPによるスクレイピングによるエラー(動的ページ)

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 744

Y.NINOMIYA

score 24

お世話になってます。
PHPを学習し始めたばかりの初心者なのですが、スクレイピングで躓いています。
こちらのサイトを参考にコードを作成したのですが実行するとエラーになってしまいます。

Fatal error: Cannot use JonnyW\PhantomJs\Client as Client because the name is already in use in C:\xampp\htdocs\main.php on line 6

実行したPHP

<?php

namespace App\Http\Controllers;

use Goutte\Client;
use JonnyW\PhantomJs\Client;

class ScrapingController extends Controller
{
    public function fetchText()
    {
        $client = Client::getInstance();
        $client->getEngine()->setPath('vendor/bin/phantomjs');

        $request = $client->getMessageFactory()->createRequest('http://localhost/main.html', 'GET');
        $response = $client->getMessageFactory()->createResponse();

        $client->send($request, $response);

        $crawler = new Crawler($response->getContent());
        $text = $crawler->filter('div')->text();
        var_dump($text); // string(20) " hoge fuga"
    }
}
?>

スクレイピングされるページのHTML(main.html)

<html>
  <body>
    <div id="text">
      <p>hoge</p>
      <!-- ここにjsでfugaを追加 -->
    </div>
  </body>
  <script type="text/javascript">
    //要素の作成
    var element = document.getElementById('text');
    var div = document.createElement('p');
    div.textContent = 'fuga';

    //最後の子要素として追加
    element.appendChild(div);
  </script>

</html>


(サイトのサンプルコードのまま)

実行環境

・Windows10pro
・xampp
・PHP 7.1.33

回答よろしくお願いします。

補足

修正したPHP

use JonnyW\PhantomJs\Client
を変更しました。

<?php

namespace App\Http\Controllers;

use Goutte\Client;
use JonnyW\PhantomJs\Client as Client_1; //ここを変更

class ScrapingController extends Controller
{
    public function fetchText()
    {
        $client = Client::getInstance();
        $client->getEngine()->setPath('vendor/bin/phantomjs');

        $request = $client->getMessageFactory()->createRequest('http://localhost/main.html', 'GET');
        $response = $client->getMessageFactory()->createResponse();

        $client->send($request, $response);

        $crawler = new Crawler($response->getContent());
        $text = $crawler->filter('div')->text();
        var_dump($text); // string(20) " hoge fuga"
    }
}
?>


その際、新たなエラーが出ました。(これで全文)

Fatal error: Class 'App\Http\Controllers\Controller' not found in C:\xampp\htdocs\main.php on line 8


クラス'App\Http\Controllers\Controller'がこのPHPに無いということだと思うのですが、そもそもどこでそのクラスを使おうとしているのでしょうか。

補足②

Goutteによるスクレイピングは実現することができ、JavaScriptによるレタリングがなされた後のページのスクレイピングを実現させたく、この質問をしました。動的ページのスクレイピングと本文に明記していませんでした。申し訳ありません。

再度よろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • m.ts10806

    2019/11/27 22:44

    main.hyml/?

    キャンセル

  • Y.NINOMIYA

    2019/11/27 22:53

    申し訳ありません、誤字でした。

    修正しておきました。

    キャンセル

  • m.ts10806

    2019/11/27 22:54

    スラッシュも含めて本当に入ってるかしりたかったんですが

    キャンセル

  • Y.NINOMIYA

    2019/11/27 23:03

    すみません、確認不足でした。
    スラッシュもありません。

    なおエラーは続いています。

    キャンセル

回答 3

checkベストアンサー

+2

こちらのサイトを参考にコードを作成

やりたい事を読み取れる個所のみを参考にする方が良いでしょう
意味が分からずコピペしてエラーになったとして、それを自力で調べられないのならその記事やコードは参考にしない方がいいでしょう

クラス'App\Http\Controllers\Controller'がこのPHPに無いということだと思うのですが、そもそもどこでそのクラスを使おうとしているのでしょうか。

学習し始めたばかりの段階では理解するのが難しいと思われます
phpでスクレイピングするのに参考になる記事をまとめている人はたくさんいると思うので、きみにとって理解のしやすい他の記事を参考にしてみるのはどうでしょうか?

スクレイピングに関しても複雑な操作を考慮しないならGoutteだけで出来るので、Goutteの作っている人のサンプルでも確認してみてはどうでしょうか?
https://github.com/FriendsOfPHP/Goutte

追記に対して

seleniumで検索すれば出てくるよ

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/11/28 14:49

    回答ありがとうございます。

    質問本文に補足もしたのですがGoutteでは既に実現しており、「動的ページのスクレイピングをしたい」というのが質問の趣旨でした。本文に明記せず申し訳ありませんでした。

    キャンセル

+1

クラス'App\Http\Controllers\Controller'がこのPHPに無いということだと思うのですが、そもそもどこでそのクラスを使おうとしているのでしょうか。

namespaceで指定しているApp\Http\ControllersControllerextendsしてます。

namespace App\Http\Controllers;
// 略
class ScrapingController extends Controller
{
// 略
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/11/29 16:26

    すごく初歩的な質問になってしまうのかもしれませんが、
    requireを使わないで外部ファイルを参照しているという事でしょうか。

    キャンセル

  • 2019/11/29 16:30

    継承もとのクラスがないよというエラーです。

    キャンセル

0

エラーメッセージの通りです。

Fatal error: Cannot use JonnyW\PhantomJs\Client as Client because the name is already in use in
Google翻訳:致命的なエラー:JonnyW \ PhantomJs \ Clientをクライアントとして使用できません。名前は既に使用されています

エラーメッセージの読み方と対処, 検索や質問の原則

ここ

use Goutte\Client;
use JonnyW\PhantomJs\Client;

Clientという名前空間はGoutte\Clientで既にuseされています。
asで別名付けましょう。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/11/28 00:23

    use JonnyW\PhantomJs\Client;
    の箇所を
    use JonnyW\PhantomJs as Client_1;
    に変更しました。
    そしたらエラー内容が
    Fatal error: Class 'App\Http\Controllers\Controller' not found in C:\xampp\htdocs\main.php on line 8
    に変わりました。クラス”App\Http\Controllers\Controller”がこのファイル内で見つからないという内容なのだと思います。そもそもクラス”App\Http\Controllers\Controller”をどこで使おうとしているのでしょうか。

    キャンセル

  • 2019/11/28 00:54

    use JonnyW\PhantomJs\Client;

    use JonnyW\PhantomJs\Client as Client_1;

    参考:https://www.php.net/manual/ja/language.namespaces.importing.php

    キャンセル

  • 2019/11/28 01:25

    指摘ありがとうございます。
    それでも同様のエラーは継続しています。

    キャンセル

  • 2019/11/28 06:24

    だから、エラーの読み方と対処の記事を先に貼ったのですけど。
    名前空間との整合性がとれてないのは間違いないのできちんと見直してください。
    ご自身で書かれたコードでしたら最も状況把握されているはずですし、提示された情報だけでは他者にはこれ以上答えようないですよ。
    推測で「合ってないんでしょう」が言えるくらいです。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.92%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る