1.閉じタグで始まっている
</p> なんとかかんとか
2.開始タグで終わっている
なんとかかんとか <p>
3.改行コード(\n)で始まっている
なんとか なんとかかんとか
4.改行コード(\n)で終わっている
なんとか なんとかかんとか
5.2連続の改行コード
なんとか なんとかかんとか
以上をそれぞれPHPの正規表現で修正したいと考えています。
以下のプログラムを思いつき試したところ、うまく行くようではあります。
しかし、沢山のtextパターンに当てはめたとき、予期せぬ動作をしないか心配です。
以下のコードに何かしらの不備がある場合、ぜひご指摘いただきたいです。
また、そもそも他のより良い方法があれば教えていただきたいです。
①
preg_replace("/(.+)<[0-9a-zA-Z]+(\s+[^\s"'>/=]+(\s*=\s*([^\s"'=><`]+|'[^']*'|"[^"]*"))?)*\s*/?>/s","$1",$LongText);
②
preg_replace("/<\/[0-9a-zA-Z]+\s*>(.+)/s","$1",$LongText);
③
preg_replace("/\n(.+)/s","$1",$LongText);
④
preg_replace("/(.+)\n/s","$1",$LongText);
⑤
preg_replace("/\n\n/s","",$LongText);
①②に関しては下記を参考にしています。
http://qiita.com/sounisi5011/items/fe6462edcb276a9ecddc
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2017/06/08 14:21
2017/06/08 14:29