質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

2回答

3191閲覧

phpを使ったwebスクレイピングについて。

sdnco

総合スコア21

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

1クリップ

投稿2016/05/05 23:27

楽天サイトの商品レビューページの口コミを抽出したく、色々なサイトを参考に自分なりにプログラムを組んでみたんですがなぜかechoで表示されません。。
どこが間違っているのかが考えても見当がつきませんでした。どうかお力を貸してくださいお願いしますm(_ _)m

php

1<?php 2 3require_once("phpQuery-onefile.php"); 4 5$mes = $_GET['url']; 6 7$leng = mb_strpos($mes,"2"); 8 9$number = mb_substr($mes,$leng,15); 10 11$dis_value = 0; 12 13 14for($i = 1; $i <= 2; $i++){ 15// htmlを取得 16$html = file_get_contents("http://review.rakuten.co.jp/item/1/$number/$i.1/"); 17 18// phpQueryのドキュメントオブジェクトを生成 19$doc = phpQuery::newDocument($html); 20} 21 22foreach ($doc["div.revRvwUserSecCnt"] -> find("div.revRvwUserSec hreview") -> find("div.revRvwUserMain") -> find("div.revUserEntry") -> find("div.revRvwUserEntryCnt revEntryNoImgCnt") find("dl.revRvwUserEntryInr") -> find("dd.revRvwUserEntryCmt description") as $rev[$count] { 23 24 $dd = pq($rev[$count])->html(); 25 echo pq($dd)->text() . "<br>"; // dd要素の中のテキストを取得して表示 26 27 $count++; 28} 29 30?>

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

echoでなくvar_dump()を使ってプリントデバッグをした方が良いです。
その上でどこらへんの処理まで正しく値が取れているか調べていくのが良いです。

var_dump($dd);
var_dump($rev[$count]);
var_dump($doc);
var_dump($html);
var_dump($number);

などを確認してみてどこで値が取れなくなるか調べてみてください

投稿2016/05/06 00:56

redara

総合スコア344

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

抜粋なのか元のコードに文法ミスがあるようですが、

とりあえず、適当なページをスクレイプしてみました。たぶん「dd.revRvwUserEntryCmt description」の様に途中にスペースが入るとクラスを認識しないようです。

※ 失礼しました。 スペースはセレクターの記法として使用できますが子孫要素になります。クラスを2つ以上持つ場合はドットでつなげること、「dd.revRvwUserEntryCmt description」ではなく「dd.revRvwUserEntryCmt.description」と記述することで使用できます。

<pre> <?php require_once("phpQuery-onefile.php"); $count = 0; $html = file_get_contents("http://review.rakuten.co.jp/item/1/306476_10000049/1.1/"); $doc = phpQuery::newDocument($html); //$doc["div.revRvwUserSecCnt.description"]; foreach ($doc["div.revRvwUserSecCnt"]->find("dd.revRvwUserEntryCmt") as $li) { $count++; echo $count.". "; echo pq($li)->text().PHP_EOL; } ?> </pre>

投稿2016/05/13 06:48

編集2016/05/13 13:27
insomnyaa

総合スコア26

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sdnco

2016/05/13 07:23

ありがとうございます! 参考にしてやってみます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問