質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.20%

正規表現と配列、特定の言葉を除く

解決済

回答 4

投稿

  • 評価
  • クリップ 0
  • VIEW 658

kagaribisou

score 16

 前提・実現したいこと

ウェブページでコメントを受け取ります。その時に特定の言葉が含まれるなら、送信できないようにしたいです。禁止ワードを配列で記憶してそれらをコメントからはじきたいです。

 発生している問題・エラーメッセージ

Warning: preg_match(): No ending delimiter '�' found in C:\xampp\htdocs\HP\common.php on line 155

 該当のソースコード

php

function evilsenser($original_word){
    $original_word = trim($original_word);//両端の空白を削除
    $bat_words = array('/罵詈雑言/','/罵詈雑言2/');
    for($i=0; $i<=count($bat_words); $i++){
        if(preg_match($original_word,'$bat_words[$i]') !== false){
            return 0;
        }
    }
    return 1;
}

 試したこと

ここに問題に対して試したことを記載してください。

 補足情報(FW/ツールのバージョンなど)

xamppで実行しています。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 4

checkベストアンサー

+4

すでに色々指摘入っていますが、マニュアル読んだほうが良いですよ。
preg_match

返り値
preg_match() は、pattern が指定した subject にマッチした場合に 1 を返します。 マッチしなかった場合は 0、エラーが発生した場合は FALSE を返します。 

なので、!== falseは意図した動作をしません。

余談
正規表現使うなら

$bat_words = '/' . implode('|',$ng_words) . '/u';


とか、してやるときれいになる気がする。

追記
まとめてみた。

<?php
$ng_words = [
    'hoge',
    'fuga',
    'piyo?',
    'hage/',
    ];


function evilsenser(array $ng_words, string $original_word){
    // $ng_words = array_map('preg_quote', $ng_words);//指摘により追記
    $ng_words = array_map(function($a){return preg_quote($a, '/');}, $ng_words);//指摘により再修正
    $bad_words = '/' . implode('|',$ng_words) . '/u';
    return (preg_match($bad_words, $original_word) === 1);
}

$test_words = [
    'test',
    'hoge',
    'hogetest',
    'testfuga',
    'tepiyost',
    'tepiyo?st',
    'tehage/st',
    ];

foreach ($test_words as $value) {
    echo $value . ':';
    var_export(evilsenser($ng_words, $value));
    echo PHP_EOL;
}

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/04 21:46

    分かりやすいコードも書いてくださりありがとうございます。
    ご指摘の通り、これからはマニュアルも活用していきたいと思います。
    上記のコードを参考に想定通りに動かすことができました。m(_ _)m

    キャンセル

  • 2018/04/06 14:03 編集

    preg_quote でデリミタ / の指定が必要です(重箱の隅ですいません

    キャンセル

  • 2018/04/06 15:11

    いやぁ、お恥ずかしい^^;
    オレこそ、マニュアル読め!ですね。。。
    修正しました!

    キャンセル

+4

適切でない箇所が2つあります。

  1. '$bat_words[$i]'と書くと、「$bat_words[$i]という文字列」の意味になってしまいます。変数の中身を使いたいときは、引用符なしで$bat_words[$i]と書いてください。
  2. 使おうとする正規表現が/罵詈雑言/のようになっていますが、UTF-8指定をして/罵詈雑言/uのように指定しておきましょう。単純一致なら問題はないですが、角カッコや繰り返しで日本語文字がバイト単位で扱われて正常動作しなくなることがあります。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/04 21:47

    ご指摘ありがとうございます。精進します。

    キャンセル

+4

preg_matchの引数が違っていませんか?

preg_match関数は、
第1引数が、正規表現のパターン "/あxxx/" のように罵詈雑言の前後を/で囲ったもの。
第2引数が、対象文字列。
(参考 preg_match)

質問のコードでは、
第1引数に対象文字列、第2引数にパターンが指定されています。
対象文字列は、正規表現のパターンのように/で囲まれていませんから、”No ending delimiter”(終わりの文字が見つからない)というエラーが出たのだと思われます。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/03 17:07

    それもだった…!

    キャンセル

+2

既に指摘が色々入っているのでプラス1のアドバイスを。

「ブラックリスト」という形で設定ファイルなどに持っておいたほうが良いように思います。
あまり処理部分に色々と情報を持たないほうがコードがすっきりしますし、
役割が明確になります。

※あと超細かいですが bat_wordsではなくて bad_wordsですね。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/04 21:49

    コードのスタイリッシュさも求めてみたいと思います。
    スペルミスは恥ずかしいですね(汗

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.20%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る