質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.08%

正規表現での式展開について

解決済

回答 5

投稿

  • 評価
  • クリップ 0
  • VIEW 1,868

teru

score 24

■環境
ruby -v
ruby 2.2.1p85 (2015-02-26 revision 49769) [x86_64-linux]

■質問
正規表現での式展開について教えてください。
lineという文があり、内容は下記になります。

line = "hoge tako ika ikura uni ebi kani"

「hoge」と「ika」という2つのキーワードがともに含まれている場合、match判定を行いたい。

line.match(/hoge/&&/ika/)

とすればマッチする。キーワード登録が複数パターンある場合、

wrod = ”hoge uni”
keyword = word.gsub(/\s/, '/&&/')
keywrod => "hoge/&&/uni"

式展開を行うとnilが帰ってきます。
pry(main)> line.match(/#{keyword}/)                                                       
=> nil 

式展開だけ確認すると

 pry(main)> p (/#{keyword}/)
/hoge\/&&\/uni/                 
=> /hoge\/&&\/uni/

となり、「/」の前に「\」のエスケープシーケンスが挿入され、matchがnilになります。


こちら式展開が
(/#{keyword}/) => (/hoge/&&/ika/)

とするのはどのようにすればよいのでしょうか。

お手数ですがお知恵を拝借いただけないでしょうか。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • yuba

    2015/09/25 12:33

    タグに「正規表現」を追加するといいと思います。

    キャンセル

  • teru

    2015/09/29 01:03

    yubaさん、アドバイスありがとうございます。

    キャンセル

回答 5

+2

rifuch様の回答とp-chan様の回答にコメントしましたが、任意の数のキーワードが含まれていることを正規表現で記述するときには肯定先読みを使うのがよろしいかと思います。

line.match(/(?=hoge)(?=ika)./)
これがhogeもしくはikaを含むことの正規表現です。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/25 13:46

    エレガントですね!

    キャンセル

  • 2015/09/30 14:46

    /(?=.*hoge)(?=.*ika)/ では?

    あと、
    > これがhogeもしくはikaを含むことの正規表現です。
    「かつ」ですね。

    キャンセル

  • 2015/09/30 17:38

    その通りでした。ご指摘ありがとうございます。

    キャンセル

+2

line.match(/hoge/&&/ika/)
とすればマッチする。
他の方の指摘のある通り、これが間違っているので、質問のそれ以降が無意味になっています。

「空白で区切られた文字列が全て含まれるかどうか?」を判断したいなら、
line = "・・・・・・・"
words = "・・・・・・・"
p words.split.all? {|word| line.include?(word)}   # 文字列として比較する場合
p words.split.all? {|word| Regexp.new(word) =~ line} # 正規表現としてマッチさせる場合

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/29 01:16

    otnさん、コメントありがとうございます。最終的には「正規表現としてマッチさせる場合」に修正となりました。

    キャンセル

checkベストアンサー

0

個別に判定して、あとから判定結果を評価するのはいかがでしょうか
(検索したいキーワードの前後関係を気にせず探せます)

line = 'hoge tako ika ikura uni ebi kani' 
keywords = 'uni kani'

p regexp_keywords = keywords.split.map { |keyword| Regexp.new(keyword) }
# => [/uni/, /kani/]
p result = regexp_keywords.map { |keyword| line.match(keyword) }
# => [#<MatchData "uni">, #<MatchData "kani">]
p result.include?(nil)
# => false

この方法であれば、String#include? でも同様のことができます

p keywords.split.map { |keyword| line.include?(keyword) }.include?(nil)
# => false

何か参考になれば幸いです

# Links

class String - split オブジェクト指向スクリプト言語 Ruby リファレンスマニュアル(Ruby 2.2.0)
class Array - include? オブジェクト指向スクリプト言語 Ruby リファレンスマニュアル(Ruby 2.2.0)
class String - include? オブジェクト指向スクリプト言語 Ruby リファレンスマニュアル(Ruby 2.2.0)
class Regexp - new オブジェクト指向スクリプト言語 Ruby リファレンスマニュアル(Ruby 2.2.0)
module Enumerable - map オブジェクト指向スクリプト言語 Ruby リファレンスマニュアル(Ruby 2.2.0)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/29 01:08

    Rebexpクラスを利用する方法を知りませんでした。この方法で進めていきます。
    ありがとうございました。

    キャンセル

0

本当にline.match(/hoge/&&/ika/)で、'hoge'と'ika'両方が含まれている文字列にマッチしますか?
この場合、式 /hoge/ && /ika/ が展開された結果の /ika/ が評価されて、
結果的にline.match(/ika/)を実行した結果が帰ってくると思うのですが。

line = "hoge tako ika ikura uni ebi kani"

line.match(/hoge/&&/ika/)
# => #<MatchData "ika"> /ika/しか判定していない
/hoge/&&/ika/
# => /ika/

# 上記 hoge uniの両方が入ってるかを判定
line.match(/hoge.*uni|uni.*hoge/)
# => #<MatchData "hoge tako ika uni">
word = 'hoge uni'
split_word = word.split(' ')
search_word = /#{split_word.join('.*')}|#{split_word.reverse.join('.*')/
# => /hoge.*uni|uni.*hoge/
line.match(search_word)
# => #<MatchData "hoge tako ika uni">

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/25 09:59

    検索ワードが2つならそれで良さそうですが、2つには限られていないようです。3つ以上だと組み合わせが急増しますが大丈夫ですかね。

    キャンセル

  • 2015/09/25 13:45

    yubaさんが回答されているとおり、肯定先読みを行うのが正しいですよね! 正規表現を考える手間を惜しんで、簡単な方法を採っていました。

    キャンセル

0

このようにすれば、一応はマッチさせることができます。正当な方法かどうかは分かりませんが…

p line.match(/#{keyword}/) 
  ⇒ nil
           ↓↓↓
p eval("line.match(/#{keyword}/)")
  ⇒ #<MatchData "uni">


<追記>
それと、rifuchさんのご指摘のように、/hoge/&&/ika/ では想定通りにマッチしないと私も思います。
それで、下記のような方法をご提案します。

keyword = "(" + word.gsub(/\s/, ').+(') + ")"
p keyword
 ⇒ "(hoge).+(uni)"
p line.match(/#{keyword}/)
 ⇒ <MatchData "hoge tako ika ikura uni" 1:"hoge" 2:"uni">

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/09/25 10:01

    追記の方法だと、キーワードが指定順に出てくることに対してマッチしていまいますが、微妙に要望と異なっている気がします。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.08%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る