質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.33%

  • JavaScript

    17539questions

    JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

  • 正規表現

    830questions

    正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

javascript の正規表現による置換がうまくいかない

解決済

回答 4

投稿

  • 評価
  • クリップ 0
  • VIEW 1,031

前提・実現したいこと

以下のhtml文字列をjavascriptの正規表現で置換したいのですがうまくいきません。

置換前の文字列

例によって金田邸へ忍び込む。<br>
 <em class="sesame_dot">例によって</em>とは<ruby><rb>今更</rb><rp></rp><rt>いまさら</rt><rp></rp></ruby>解釈する必要もない。

↓↓↓こうしたい

望んでる置換後の文字列

<span class="my_color">例によって金田邸へ忍び込む。</span><br>
 <em class="sesame_dot"><span class="my_color">例によって</span></em><span class="my_color">とは</span><ruby><rb><span class="my_color">今更</span></rb><rp></rp><rt>いまさら</rt><rp></rp></ruby><span class="my_color">解釈する必要もない。</span>

やりたいことはタグとタグの間の文字列を class を持った span タグで囲むことです。ただし、rp タグ、rtタグ、rubyタグは囲まない。

発生している問題

次のような 正規表現を javascript で書きましたがうまくいきません。

//タグとタグの間の文字列を span で囲む
text = text.replace(/(<(?!ruby|rt|rp)[^<]*?>)([^<]+)(<[^<]*?>)/g,'$1<span class="my_color">$2</span>$3');

//文頭から最初のタグまでの文字列を span で囲む
text = text.replace(/^([^<]+?)</gm,'<span class="my_color">$1</span><');

//最後のタグから文末までの文字列を span で囲む
text = text.replace(/>([^>]+)$/g,'><span class="my_color">$1</span>');

実際の置換後のhtml

<span class="my_color">例によって金田邸へ忍び込む。</span><span class="br"></span><span class="my_color">
 </span><em class="sesame_dot">例によって</em><span class="my_color">とは</span><ruby><rb><span class="my_color">今更</span></rb><rp></rp><rt>いまさら</rt><rp></rp></ruby><span class="my_color">解釈する必要もない。</span>


em タグに囲まれた文字列「例によって」が span タグで囲まれない!

原因が分かりません。どうすれば希望通りの置換ができますか?

よろしくお願いします!!

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 4

+2

ちょっと違うアプローチですが、こんなの。

text = (">"+text+"<").replace(/>[^<][\s\S]*?</g,"><span class=\"my_color\"$&/span><");
text = text.substr(1,text.length-2);
text = text.replace(/(<(ruby|rp|rt)>)<span class="my_color">|<\/span>(<\/(ruby|rp|rt)>)/g,"$1$3");

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/28 00:51

    回答ありがとうございます。

    text = (">"+text+"<").replace(/>[^<][\s\S]*?</g,"><span class=\"my_color\"$&/span><");

    ↑これってあってますか?$&は何をあらわしているのでしょうか?

    キャンセル

  • 2017/01/28 01:17 編集

    $&はマッチした文字列(">~<")です。その両側にspanを付けます。とりあえず全部にspanを付けて、その後で不要な部分を削除します。

    キャンセル

+1

 String.prototype.replace

要件にはありませんが、期待する置換結果を見る限りでは
空白文字のみのテキストを読み飛ばす条件があるようですね。
何度も置換処理を走らせると想定外の状況が生まれて意図せぬマッチが発生しやすいので、一度の置換処理にまとめると良いと思います。

'use strict';
var text = '例によって金田邸へ忍び込む。<br>\r\n <em class="sesame_dot">例によって</em>とは<ruby><rb>今更</rb><rp>(</rp><rt>いまさら</rt><rp>)</rp></ruby>解釈する必要もない。';

text = text.replace(/(^|>)(?!\s+(?:<|$))([^<]+)(?=<(?!\/r(?:[pt]|uby)>)|$)/g, '$1<span class="my_color">$2</span>');
console.log(text);  // <span class="my_color">例によって金田邸へ忍び込む。</span><br>\r\n <em class="sesame_dot"><span class="my_color">例によって</span></em><span class="my_color">とは</span><ruby><rb><span class="my_color">今更</span></rb><rp>(</rp><rt>いまさら</rt><rp>)</rp></ruby><span class="my_color">解釈する必要もない。</span>

 更新履歴

  • 2017/01/28 19:39 入力文字列に改行コード後の半角スペースが抜けていたのを修正

Re: hikochang さん

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

checkベストアンサー

0

これなんてどうでしょうか?
問題の箇所は

  • 改行にもタグを囲んじゃってる
  • タグ閉じとタグ開始の間にある文字が抜けている
  • スペースだけの場合でもタグを囲んでる

そんな感じですね。

    //タグとタグの間の文字列を span で囲む
    text = text.replace(/(<(?!ruby|rt|rp)[^<]*?>)([^<\n]+)(<[^<]*?>)/g,'$1<span class="my_color">$2</span>$3');

    //文頭から最初のタグまでの文字列を span で囲む
    text = text.replace(/^([^<]+?)</gm,'<span class="my_color">$1</span><');

    //最後のタグから文末までの文字列を span で囲む
    text = text.replace(/>([^>]+)$/g,'><span class="my_color">$1</span>');

    // タグの狭間のくくりを追加
    text = text.replace(/(<\/[^>]+>)([^<]+)(<[^>]+?>)/g,'$1<span class="my_color">$2</span>$3');

    // ダサいスペースだけのタグくくりを排除
    text = text.replace(/<span class="my_color">\s+<\/span>/g,'');

追記)  0:36 参考までにフルソース

<html>
<script src="http://code.jquery.com/jquery-3.1.1.min.js"></script>
<script>
$(function() {
  $("#change").on("click",function() {
    var text = $("#request").val();
    //タグとタグの間の文字列を span で囲む
    text = text.replace(/(<(?!ruby|rt|rp)[^<]*?>)([^<\n]+)(<[^<]*?>)/g,'$1<span class="my_color">$2</span>$3');

    //文頭から最初のタグまでの文字列を span で囲む
    text = text.replace(/^([^<]+?)</gm,'<span class="my_color">$1</span><');

    //最後のタグから文末までの文字列を span で囲む
    text = text.replace(/>([^>]+)$/g,'><span class="my_color">$1</span>');

    // タグの狭間のくくりを追加
    text = text.replace(/(<\/[^>]+>)([^<]+)(<[^>]+?>)/g,'$1<span class="my_color">$2</span>$3');

    // ダサいスペースだけのタグくくりを排除
    text = text.replace(/<span class="my_color">\s+<\/span>/g,'');

    $("#result").val(text);
  });
});
</script>
<body>
<textarea id="request" style="width:800;height:160;">
  例によって金田邸へ忍び込む。<br>
   <em class="sesame_dot">例によって</em>とは<ruby><rb>今更</rb><rp></rp><rt>いまさら</rt><rp></rp></ruby>解釈する必要もない。
</textarea>
<br>
<input type="button" value="変換" id="change"><br>
<textarea id="result" style="width:800;height:160;">
</textarea>
<textarea id="answer" style="width:800;height:160;">
  <span class="my_color">例によって金田邸へ忍び込む。</span><br>
 <em class="sesame_dot"><span class="my_color">例によって</span></em><span class="my_color">とは</span><ruby><rb><span class="my_color">今更</span></rb><rp></rp><rt>いまさら</rt><rp></rp></ruby><span class="my_color">解釈する必要もない。</span>
</textarea>
</body>
</html>

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/01/28 00:29

    回答ありがとうございます。
    しかしうまくいきませんでした。なぜでしょうか?

    キャンセル

0

一旦すべてのタグとタグの間の文字列を class を持った span タグで囲む。
次に rp タグ、rtタグ、rubyタグについては spanタグを削除する。

text = text.replace(/>[^<>]+</g,'><span class="my_color"$0/span><');
text = text.replace(/^[^<>]+/g,'<span class="my_color">$0<\/span>');
text = text.replace(/>[^<>]+$/g,'><span class="my_color"$0<\/span>');
text = text.replace(/<rt><span class="my_color">/g,'<rt>');
text = text.replace(/<\/span><\/rt>/g,'</rt>');
text = text.replace(/<rp><span class="my_color">/g,'<rp>');
text = text.replace(/<\/span><\/rp>/g,'</rp>');
text = text.replace(/<ruby><span class="my_color">/g,'<ruby>');
text = text.replace(/<\/span><\/ruby>/g,'</ruby>');

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.33%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • JavaScript

    17539questions

    JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

  • 正規表現

    830questions

    正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。