質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

1回答

2633閲覧

PHP Simple HTML DOM Parser スクレイピングに関して

K_T_T_K

総合スコア231

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2015/03/25 10:42

この食べログURLから

「ジャンル」と「住所」だけを取得するプログラムを作っているのですが、
class属性やid要素がなく取得する方法が困難です。

例えば、ジャンルには
<span property="v:category">
となっており、ジャンルであれば
ベーグル、パン・サンドイッチ(その他)、パン
を取得したいです。

この場合、Simple HTML DOM Parser で「ジャンル」「住所」を取得する方法としてどなたか
良い方法ありましたら教えて頂けないでしょうか?

因に、
http://sourceforge.net/projects/simplehtmldom/files/
から
simple_html_dom.phpをダウンロードする事で、Simple HTML DOM Parserすることが出来ます。

以上宜しくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

実際に試していないのでアレですが、属性セレクタ span[property=v:category] を使えばいけるんじゃないでしょうか。

自分だったら、Simple HTML DOM Parserはわりと面倒なことが多いので、正規表現で取ってしまうと思います。以下のような感じです。

lang

1<?php 2$html = file_get_contents('http://tabelog.com/hokkaido/A0105/A010501/1025411/'); 3preg_match_all('|<span property="v:category">(.+?)</span>|', $html, $matches); 4$genres = $matches[1]; 5preg_match('|<p rel="v:addr">(.+?)</p>|', $html, $matches); 6$address = strip_tags($matches[1]);

これで$genresにジャンル$addressに住所が入ります。

投稿2015/03/25 12:32

naga3

総合スコア1293

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

K_T_T_K

2015/03/25 15:19

ベストアンサーを押させて頂きます。 ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問