質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

foreach

foreachは、List・Collection・Arrayといったデータ構造の各要素に対して繰り返し処理を実行するために扱われる、制御構造の構文です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

1回答

1374閲覧

PHP スクレイピング Foreach文の重複を避ける

shuto0901

総合スコア16

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

foreach

foreachは、List・Collection・Arrayといったデータ構造の各要素に対して繰り返し処理を実行するために扱われる、制御構造の構文です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2021/12/20 09:01

前提・実現したいこと

foreachの重複を避けたい。

ここに質問の内容を詳しく書いてください。
PHPスクレイピングにて、それぞれの記事に紐づいているキーワード一覧を取得しております。

発生している問題

キーワードの数だけループが回ってしまう。
→全てのキーワードを一回のループで取得したい
例)下記表示コード(2記事分ループが回っている)では、1記事目は3つ目の配列(array(3))
2記事目は5つ目の配列(array(5))のみ取得したい。

array(1) { [0]=> string(6) "調査" } array(2) { [0]=> string(6) "調査" [1]=> string(18) "オフィスビル" } array(3) { [0]=> string(6) "調査" [1]=> string(18) "オフィスビル" [2]=> string(12) "オフィス" } array(1) { [0]=> string(12) "都市開発" } array(2) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" } array(3) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" [2]=> string(12) "商業施設" } array(4) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" [2]=> string(12) "商業施設" [3]=> string(6) "海外" } array(5) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" [2]=> string(12) "商業施設" [3]=> string(6) "海外" [4]=> string(15) "三井不動産" }

該当のソースコード

foreach($posts_data as $key => $post){ //投稿日時(日本時刻に合わせて投稿ごとに1秒ずつずらす) $date = date('Y-m-d H:i:s', strtotime('+'.((int)$i + (9 * 60 * 60)).'second')); $post_author = ""; $post_url = 'https://www.re-port.net/article/news/00000'.$post['number']; // 個別記事のファイルの内容を文字列に読み込む $html = file_get_contents($post_url); // 個別記事のphpQueryのドキュメントオブジェクトを生成 $htmlData = phpQuery::newDocument($html); // array関数を$KeywordListに代入 $KeywordList = array(); // .side--keyword--to-listのオブジェクトを取得 $findKeywordList = $htmlData->find(".side--keyword--to-list"); $array = ['政策','不動産流通','賃貸仲介・管理']; foreach($findKeywordList as $key => $findKeyword) { $KeywordList[] = $findKeyword->nodeValue; // $i++; // echo('<pre>'); // var_dump($KeywordList); // echo('<pre>'); if(in_array($KeywordList, $array,true)) { $arrays = array( 'category' => $KeywordList, ); } }

試したこと

・$KeywordList[] = $findKeyword->nodeValue;の部分をforeachから外す
・取得するオブジェクトのクラス名を変更
・in_array関数を用いたif分の中身を変更(arrayの項目を増やす)

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

phpQueryは使ったことはないですが、ドキュメントを参照して思いついたコードがこちらです:

php

1$findKeywordList = $htmlData->find(".side--keyword--to-list"); 2$KeywordList = []; 3phpQuery::each($findKeywordList, function($index, $value){ 4 $KeywordList[] = $value->text(); 5});

そもそもeach()もfor文を使ってループしてると思いますけど。

投稿2021/12/20 12:32

skys215

総合スコア910

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問