質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.36%

  • PHP

    21249questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

【PHP】【NGリスト】を複数ページで一括利用できる方法

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 156

shimane

score 82

現在、プログラミングの勉強をしている初心者です。

スクレイピングを行うサイトを勉強目的で作成しているのですが
取得した各ブログ記事のタイトル文章に「特定のNGワード」が入っていた場合に
「continue」を行い、次のループ取得を行うといった事をしているのですが、
取得するブログの数だけ複数のページがある(30個程)ので
1か所だけを変更するだけで複数のページのNGリストを一括で変更出来るようにしたいです。


【現在】

test1.php

require_once(__DIR__ . '/../bbsmysql.php');
require_once(__DIR__ . '/../function.php');

try {
  $db = new \PDO(DSN, DB_USERNAME, DB_PASSWORD);
  $db->setAttribute(\PDO::ATTR_ERRMODE, \PDO::ERRMODE_EXCEPTION);
  echo "データベースへの接続が出来ました";
}catch (\PDOException $e) {

  echo $e->getMessage();
  exit;
}

foreach ($doc[".CONTENTS"] as $entry){

//タイトル取得
$title = pq($entry)->find('.blog_title')->text();

if($title === "" ||
strpos($title,"自殺") !== FALSE ||
strpos($title,"覚醒剤") !== FALSE ||
strpos($title,"殺害予告") !== FALSE
) {
  continue;
}
}
test2.php

require_once(__DIR__ . '/../bbsmysql.php');
require_once(__DIR__ . '/../function.php');

try {
  $db = new \PDO(DSN, DB_USERNAME, DB_PASSWORD);
  $db->setAttribute(\PDO::ATTR_ERRMODE, \PDO::ERRMODE_EXCEPTION);
  echo "データベースへの接続が出来ました";
}catch (\PDOException $e) {

  echo $e->getMessage();
  exit;
}

foreach ($doc[".CONTENTS"] as $entry){

//タイトル取得
$title = pq($entry)->find('.blog_title')->text();

if($title === "" ||
strpos($title,"自殺") !== FALSE ||
strpos($title,"覚醒剤") !== FALSE ||
strpos($title,"殺害予告") !== FALSE
) {
  continue;
}
}
function.php

function h($s) {
  return htmlspecialchars($s, ENT_QUOTES, 'UTF-8');
}

スクレイピングで取得した登録しているブログの記事タイトルの文章が0文字だったり
「自殺」「覚醒剤」「殺害予告」が含まれている場合にcontinueで次のループに移動しています。

現在はtest1.php,test2.php,test3.php……といった風に複数のスクレイピング取得ページに
それぞれコードを書いているのですが
NGリストに新しく1個追加したり、1個削除する場合に複数ページにて変更を行わないといけなくて大変になっています。

これを複数のページにて読み込んでいる「function.php」にて一括で設定する事が出来れば
運営がとても助かるのですが、上手く行う事が出来ませんでした。

プログラムの勉強をしたばかりの初心者で、何か勘違いしている点や
何かお気付きになった点がある方や
解決する方法をご存知の方がおりましたら
教えて頂けますと、とても嬉しいです。
どうかよろしくお願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • mts10806

    2018/06/07 21:11

    タイトルには要件のみを記載してください。タグにある内容や、要件と関係のない文言はタイトルだけを見たときに質問内容を想像しづらくするのでなるべく入れないようにしてください。(質問本文も同様です。ノイズが多いと何が伝えたいのか分かりづらくなります)https://teratail.com/help/question-tips#questionTips3-1 >ありがちな失敗としては、「助けてください」「初心者です」という表題をつけてしまうことです

    キャンセル

  • shimane

    2018/06/07 21:16

    mts10806さん 有難うございます。まだまだ不慣れで、ご迷惑をお掛けして申し訳ありません。 ご指摘された箇所【初心者】という部分をタイトルから削除致しました。

    キャンセル

  • mts10806

    2018/06/07 21:30

    タグにある内容も冒頭に書くことにより要件部分までの距離が長くなるのでタイトルになくてもいいかなと思います。質問一覧から見たときにタグが正しく設定されていればそれで分かるので。

    キャンセル

  • shimane

    2018/06/07 23:07

    有難うございます。 プログラム関係や頭脳系の勉強や学校に通う事が少ないような人生だったので、良かれと思った事が迷惑をおかけしてる事になる事も多いので、こういった指摘をして頂けると、とても嬉しく感じています。大感謝です!

    キャンセル

回答 1

checkベストアンサー

+1

一番簡単なのは共通で設定を持つことです。
リスト形式でたくさんあるならNGリストを配列で持てば良いかと。

function.php

$ngList = ["NGワード1","NGワード2","NGワード3"];


testXX.php

require_once(__DIR__ . '/../function.php');


//中略

$title = pq($entry)->find('.blog_title')->text();

//NGワードを含むチェック
$ngresult = array_filter($ngList, function($ngword) use ($title) {
    return strpos($title,$ngword);
});
if($ngresult > 0){
 continue;
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/07 23:12

    mts10806さん、回答を有難うございます。

    >一番簡単なのは共通で設定を持つことです。
    リスト形式でたくさんあるならNGリストを配列で持てば良いかと。

    この回答をして頂けた事で問題を解決する事が出来ました!有難うございます。

    //NGワードを含むチェック
    foreach($ngList as $nglist1) {
    if($title === "" ||
    strpos($title,$nglist1) !== FALSE) {
    continue 2;
    }
    }

    array_filter()について、勉強不足で上手く利用する事が出来ませんでした。
    まずは教えて頂いたNGリストの配列を利用していく形でforeach文でのNGリストの作成が出来ました。

    これからもPHPの勉強を進めて教えて頂いたarray_filter()を利用した方法でも出来るように頑張ってみます。

    教えて頂いた事で、次の勉強に進めていく事が出来るようになりました。大感謝です!

    キャンセル

  • 2018/06/08 06:04

    後学のため、ですが、foreachで配列から取り出す中身が単体の文字列がnglistという名前では辻褄があいません。
    マジックナンバーは数ヵ月後の自身のためにもならないので避けられた方が良いですよ。
    三日見なかったら他人のコード という言葉も聞きます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.36%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • PHP

    21249questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。