質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

foreach

foreachは、List・Collection・Arrayといったデータ構造の各要素に対して繰り返し処理を実行するために扱われる、制御構造の構文です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

解決済

PHP スクレイピング Foreach文の重複を避ける

shuto0901
shuto0901

総合スコア16

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

foreach

foreachは、List・Collection・Arrayといったデータ構造の各要素に対して繰り返し処理を実行するために扱われる、制御構造の構文です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

1回答

0評価

0クリップ

443閲覧

投稿2021/12/20 09:01

前提・実現したいこと

foreachの重複を避けたい。

ここに質問の内容を詳しく書いてください。
PHPスクレイピングにて、それぞれの記事に紐づいているキーワード一覧を取得しております。

発生している問題

キーワードの数だけループが回ってしまう。
→全てのキーワードを一回のループで取得したい
例)下記表示コード(2記事分ループが回っている)では、1記事目は3つ目の配列(array(3))
2記事目は5つ目の配列(array(5))のみ取得したい。

array(1) { [0]=> string(6) "調査" } array(2) { [0]=> string(6) "調査" [1]=> string(18) "オフィスビル" } array(3) { [0]=> string(6) "調査" [1]=> string(18) "オフィスビル" [2]=> string(12) "オフィス" } array(1) { [0]=> string(12) "都市開発" } array(2) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" } array(3) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" [2]=> string(12) "商業施設" } array(4) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" [2]=> string(12) "商業施設" [3]=> string(6) "海外" } array(5) { [0]=> string(12) "都市開発" [1]=> string(12) "開発計画" [2]=> string(12) "商業施設" [3]=> string(6) "海外" [4]=> string(15) "三井不動産" }

該当のソースコード

foreach($posts_data as $key => $post){ //投稿日時(日本時刻に合わせて投稿ごとに1秒ずつずらす) $date = date('Y-m-d H:i:s', strtotime('+'.((int)$i + (9 * 60 * 60)).'second')); $post_author = ""; $post_url = 'https://www.re-port.net/article/news/00000'.$post['number']; // 個別記事のファイルの内容を文字列に読み込む $html = file_get_contents($post_url); // 個別記事のphpQueryのドキュメントオブジェクトを生成 $htmlData = phpQuery::newDocument($html); // array関数を$KeywordListに代入 $KeywordList = array(); // .side--keyword--to-listのオブジェクトを取得 $findKeywordList = $htmlData->find(".side--keyword--to-list"); $array = ['政策','不動産流通','賃貸仲介・管理']; foreach($findKeywordList as $key => $findKeyword) { $KeywordList[] = $findKeyword->nodeValue; // $i++; // echo('<pre>'); // var_dump($KeywordList); // echo('<pre>'); if(in_array($KeywordList, $array,true)) { $arrays = array( 'category' => $KeywordList, ); } }

試したこと

・$KeywordList[] = $findKeyword->nodeValue;の部分をforeachから外す
・取得するオブジェクトのクラス名を変更
・in_array関数を用いたif分の中身を変更(arrayの項目を増やす)

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

foreach

foreachは、List・Collection・Arrayといったデータ構造の各要素に対して繰り返し処理を実行するために扱われる、制御構造の構文です。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。