質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.84%

  • 正規表現

    706questions

    正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

  • Go

    430questions

    Go(golang)は、Googleで開発されたオープンソースのプログラミング言語です。

該当箇所が複数あったとき、重複した部分がある時に重複許容させながら正規表現検索

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 522

gizennsyax

score 3

正規表現で文字列抽出しようとした場合、該当箇所があった最後の文字から次の検索がされます。

例として以下の文字列から

<p>Text One</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<p>Text Two</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<p>Text Three</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<p>Text Four</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<p>Text Five</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>


以下のブロックを抜き出そうとするとき

<p>Text Number</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>


以下のregexを指定すると

<p>[\s\S]*?</table>[\s\S]*?<p>


該当箇所が2か所になります

<p>Text One</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<p>
<p>Text Three</p>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<table><tr><td>Cell</td><td>Cell</td></tr></table>
<p>


(判りにくくてすみません...)

この該当箇所の最後の部分を重複許容させて正規表現で検索したいのですが、そういったやり方は可能でしょうか。(上の例の5ブロックをすべて抽出できる表現の仕方でも構いません)

何卒よろしくお願い申し上げます。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

+1

正規表現で検索を掛ける場合、重複して検索されるかは処理系・検索方法の問題です(極端な話、「1つ目しかヒットしない」というような手法もあります)。そっちをはっきりさせてください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/10 12:20

    goのregexpパッケージを使用しております。
    検索方法はmultiline,globalです。
    multiline : 複数行にまたがって検索
    global : 結果を複数返す
    よろしくお願いします。

    キャンセル

  • 2018/05/10 12:37 編集

    ヒントを頂いて考えてみたのですが、一つ目のみヒットさせて重複部分を含めずに該当箇所を削除、一つ目のみヒットさせて重複部分を含めずに該当箇所を削除、を繰り返していけば最終的にヒットなしとなり、すべて取り出せそうです。

    一応解決法は見えてきたので解決済みにしますが、もしもっと良い方法があればご教授お願いいたします。

    キャンセル

check解決した方法

0

ヒントを頂いて考えてみたのですが、一つ目のみヒットさせて重複部分を含めずに該当箇所を削除、一つ目のみヒットさせて重複部分を含めずに該当箇所を削除、を繰り返していけば最終的にヒットなしとなり、すべて取り出せそうです。

一応解決法は見えてきたので解決済みにしますが、もしもっと良い方法があればご教授お願いいたします。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.84%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    Swift3 TableViewの文字がダブって表示されてしまいます。

    前提・実現したいこと 現在coradetaからデータを取り出しTableViewカスタムセルを使って2つのlabelを表示しています。 始め起動時には入力した文字或いは入力した文字

  • 解決済

    上下左右を中央にしたい

    いつもお世話になります。 下記のイメージのようなナビゲーションを作成したいのですが、 テキスト部分の上下左右の中央が上手くいきません。 ※何行になっても上下左右中央にしたい

  • 解決済

    css の justify が思い通りに動かない

     やりたい事 html + css を使ってピアノ発表会のプログラム表を作っています。 曲順、曲名、作曲者名、演奏者名 を表形式に表示させることを考えてるのですが、 作曲者名、演奏

  • 解決済

    Bootstrapにおいてのnavberの固定方法

    前提・実現したいこと 現在Bootstrapの勉強をしております。 WebPageにnavberを実装しようとBootstrapnのHPや各説明サイト等を利用し、お手本をそのまま

  • 解決済

    iScroll.jsを使用してコンテンツを横スクロールにする

    現在横スクロールを実現するためにiScroll.jsというライブラリを使用しています。 そこで横スクロールさせたいコンテンツの始点を右端にしスクロールすると左にコンテンツが移動する

  • 解決済

    全面でリンクしているセルの中の文字を中段で表示させたい

    下記のソースは、<td>から</td>までの全面でリンクするようにしているのですが、その中の文字位置が、中央はできるのですが、中段ができません。 文字を中段で表示させるためには、ど

  • 解決済

    Javascriptのテーブルのクリックイベントについて

    いつもお世話になっています。 javascriptを使って人VS人の将棋のゲームを作っているものです。 現在は、HTMLに9×9のテーブルを作成しており、テーブルの任意のセルを

  • 受付中

    パディングを消せない

     前提・実現したいこと テーブルセルを使うと高さ揃えにパディングが加わると効きました。 ですが、パディングを0にして試してもパディングが削除できませんでした。 これはなぜなんでしょ

同じタグがついた質問を見る

  • 正規表現

    706questions

    正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

  • Go

    430questions

    Go(golang)は、Googleで開発されたオープンソースのプログラミング言語です。

  • トップ
  • Goに関する質問
  • 該当箇所が複数あったとき、重複した部分がある時に重複許容させながら正規表現検索