質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CentOS

CentOSは、主にRed Hat Enterprise Linux(RHEL)をベースにした、フリーのソフトウェアオペレーティングシステムです。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

3回答

3592閲覧

html中の特定リンクid=以下urlを全てurlエンコード

seel

総合スコア25

CentOS

CentOSは、主にRed Hat Enterprise Linux(RHEL)をベースにした、フリーのソフトウェアオペレーティングシステムです。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2016/07/15 12:07

編集2016/07/15 23:21

a.html内のid=以降を全てurlエンコードしたいです。

これが

html

1<a href="http://exmple.com/id=http://exmple.com/abc/a123/"> 2<a href="http://exmple.com/id=http://exmple.com/abc/b456/"> 3<a href="http://exmple.com/id=http://exmple.com/abc/c789/"> 4 5・・・

これになればいいという意味です。
再現するためにサイトで手動エンコードしました。

<a href="http://exmple.com/id=http%3A%2F%2Fexmple.com%2Fabc%2Fa123%2F%0D%0A/"> <a href="http://exmple.com/id=http%3A%2F%2Fexmple.com%2Fabc%2Fb456%2F%0D%0A/"> <a href="http://exmple.com/id=http%3A%2F%2Fexmple.com%2Fabc%2Fc789%2F%0D%0A/">

自分で考えたものはこんな感じのイメージでした。

php

1$html = file_get_contents('file.html'); 2$string = $html; 3$pattern = ""; //置換対象検索文字列(正規表現 id=以降部分) 4$eurl = (urlencode("$pattern")); //$patternでurlencode 5$replacement = "$eurl"; //$patternを$eurlに置換 6echo preg_replace($pattern,$replace,$string);//出力 7

どななたわかる方、教えてください。
よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

う~ん、何が何になれば納得できるのでしょうか?
最初の=まではurlencodeしないほうが良さそうなのでそうしてあります

PHP

1<?PHP 2$string = <<<STR 3http://exmple.com/id=http://exmple.com/abc/以降ランダム/ 4http://exmple.com/id=http://exmple.com/abc/102912/ 5http://exmple.com/id=http://exmple.com/abc/327429/ 6http://exmple.com/id=http://exmple.com/abc/349094/ 7STR; 8$pattern="|(http://exmple.com/.+=)(.*$)|m" ; 9$replacement=function($a){return $a[1].urlencode($a[2]);}; 10$string=preg_replace_callback($pattern,$replacement,$string); 11print nl2br($string); 12?>

追記

hrefの中の処理であればこんな感じで?

PHP

1<?PHP 2$string=<<<eof 3test 4<a href="http://exmple.com/id=http://exmple.com/abc/a123/"> 5<a href='http://exmple.com/id=http://exmple.com/abc/b456/'> 6<a href="http://exmple.com/id=http://exmple.com/abc/c789/"> 7test 8eof; 9$pattern="|(href=([\"'])http://exmple.com/.+?=)(.+)(?=\\2)|m" ; 10$replacement=function($a){return $a[1].urlencode($a[3]);}; 11$string=preg_replace_callback($pattern,$replacement,$string); 12print nl2br(htmlspecialchars($string)); 13

投稿2016/07/15 13:37

編集2016/07/19 01:12
yambejp

総合スコア114769

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

seel

2016/07/15 19:15

追記しました。
yambejp

2016/07/19 01:13

追記分を反映しておきました 「%0D%0A」はいらないですよね?
seel

2016/07/19 16:40

はい、「%0D%0A」はサイトの改行の都合でできたのかもしれません。 追記とご指摘ありがとうございます。
guest

0

PHP

1$html = file_get_contents('a.html'); 2list($u1, $u2) = explode('=', $html); 3echo $u1 . '=' . urlencode($u2);

イコールが複数存在するってんなら、
エンコードしない分の長さをもっといて
substr() で切り出して urlencode() するとか?

投稿2016/07/15 12:15

takasima20

総合スコア7458

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

parse_url() を使ったほうが楽で間違いがないと思いますよ。

ereg_replace()

警告

この関数は PHP 5.3.0 で 非推奨 となり、 PHP 7.0.0 で 削除 されました。
この関数の代替として、これらが使えます。
preg_replace()


php

1 2$string = <<<STR 3http://exmple.com/id=http://exmple.com/abc/102912/ 4http://exmple.com/id=http://exmple.com/abc/327429/ 5http://exmple.com/id=http://exmple.com/abc/349094/ 6STR; 7 8$res = array(); 9$lines = explode(PHP_EOL, $string); 10foreach ($lines as $line) { 11 $url = parse_url($line); 12 $path = $url['path']; 13 $arr = explode('=', $path); 14 15 $res[] = sprintf('%s://%s%s=%s' 16 , $url['scheme'] 17 , $url['host'] 18 , $arr[0] 19 , urlencode($arr[1]) 20 ); 21} 22var_dump($res);

投稿2016/07/15 12:10

編集2016/07/15 13:49
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

seel

2016/07/15 13:08

試してみましたが動かなかったです。 僕の環境が特殊なのでしょうか、普通にcentos6.7で ドキュメントルートにてphpを動かしています。 いろんなアドバイスをいただいてきましたが 僕の今の状態では別の方法で迷宮入りするか 教えていただいたものが動かないということが続いております。 id=以降を全てurlencodeするだけですので なにかいい方法はないでしょうか。
退会済みユーザー

退会済みユーザー

2016/07/15 13:23 編集

> 動かなかったです。 具体的にどうなったのかが書かれていないと回答のしようがありません。 コードとともに結果を書いてください。 そもそもですが、もともとのURLのフォーマットがおかしいことにお気付きですか?
seel

2016/07/15 13:24 編集

そもままコピペして保存しブラウザで開きましたが画面が真っ白でした。
退会済みユーザー

退会済みユーザー

2016/07/15 13:26 編集

ini_set('display_errors', 1); error_reporting(E_ALL); を記述して、エラーを表示する設定にしましょう。
seel

2016/07/15 13:32 編集

文末に追記しましたがまだ真っ白です。 もしエラーが無いということなら結果がechoされていないのかもしれません。 本来var_dump($res);でechoされてると思うのですが ・・。
退会済みユーザー

退会済みユーザー

2016/07/15 13:29

文頭でなければなりません
seel

2016/07/15 13:36

<?php ini_set('display_errors', 1); error_reporting(E_ALL); $string = <<<STR http://exmple.com/id=http://exmple.com/abc/102912/ http://exmple.com/id=http://exmple.com/abc/327429/ http://exmple.com/id=http://exmple.com/abc/349094/ STR; $res = []; foreach (explode(PHP_EOL, $string) as $line) { $url = parse_url($line); $path = $url['path']; $arr = explode('=', $path); $res[] = sprintf('%s://%s%s=%s' , $url['scheme'] , $url['host'] , $arr[0] , urlencode($arr[1]) ); } var_dump($res); やっぱり真っ白です。 環境がおかしいのでしょうか。
退会済みユーザー

退会済みユーザー

2016/07/15 13:42 編集

> 環境がおかしいのでしょうか。 わかりません。それを聞くのであれば、せめてPHPのバージョン情報くらい提示しましょう。 あと、コメント欄では実際のコードが正しく表示されませんので、質問欄に追記してください。
seel

2016/07/15 13:47

centos6.7 desktop install PHP 5.3.3 (cli) (built: May 10 2016 21:39:50) Copyright (c) 1997-2010 The PHP Group Zend Engine v2.3.0, Copyright (c) 1998-2010 Zend Technologies いま外部が表示できない状態ですがlocalhostにてphpを動かしています。 php,html共に表示できています。 $html = file_get_contents('a.html'); $string = "$html"; $pattern = "https?://[\w/:%#\$&\?\(\)~\.=\+\-]+"; $replacement = urlencode("$pattern"); echo ereg_replace($pattern, $replacement, $string); これも動きました。
退会済みユーザー

退会済みユーザー

2016/07/15 13:50

回答を5.3で動くコードに修正しておきました。
seel

2016/07/15 20:10

乱雑ですみません、目的を質問欄にわかりやすく追記いたしました。
seel

2016/07/19 16:42

気の利かないコメントですみません。 5.3にコード、ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問