質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

1回答

2259閲覧

simple_html_dom スクレイピングについて

pro_hiromu

総合スコア12

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2015/08/31 13:51

simple_html_domを使用し、スクレイピングをしているのですが、

php

1<?php 2 // simple_html_dom.phpをインクルード 3 include_once('simple_html_dom.php'); 4 5 // スクレイピングしたいURLを指定 6 $html = file_get_html( 'http://www.osaka-johall.com/event/' ); 7 8 // 引っ張るものを指定してa.entry-link要素を$elementに代入 9 foreach($html->find('div[class="schetitle"]') as $element){ 10 11 // 吐き出す 12 echo $element->plaintext . '<br>'; 13 } 14?> 15

今、**div[class="schetitle"]**を取得しているのですが、さらに、thもあわせて取得したく、さらに交互に出力したいです。
どうすればいいでしょうか。

あと、このコードじゃ、同じ単語を2週してしまうのですがなぜでしょうか。
回答、お願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

<div class="event0 event">の中のtrを取得してループで回す。 thを出力 div[class="schetitle"]を出力

同じ単語を2週というか、htmlのソースを見るとわかりますが、「すべて」と「アリーナ」タブで同じ単語があるからです。
これはclass="event0"を指定することで回避できます。

たとえば以下のような感じで。

// 引っ張るものを指定してa.entry-link要素を$elementに代入 foreach($html->find('div[class="event0"]',0)->find('tr') as $element){ // 吐き出す echo $element->find('th',0)->plaintext . '<br>'; echo $element->find('div[class="schetitle"]',0)->plaintext . '<br>';

投稿2015/09/12 17:24

lightwill

総合スコア962

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問