質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

5回答

2668閲覧

正規表現での式展開について

teru

総合スコア22

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2015/09/24 16:53

■環境
ruby -v
ruby 2.2.1p85 (2015-02-26 revision 49769) [x86_64-linux]

■質問
正規表現での式展開について教えてください。
lineという文があり、内容は下記になります。

line = "hoge tako ika ikura uni ebi kani"

「hoge」と「ika」という2つのキーワードがともに含まれている場合、match判定を行いたい。

line.match(/hoge/&&/ika/)

とすればマッチする。キーワード登録が複数パターンある場合、

wrod = ”hoge uni”
keyword = word.gsub(/\s/, '/&&/')
keywrod => "hoge/&&/uni"

式展開を行うとnilが帰ってきます。
pry(main)> line.match(/#{keyword}/)
=> nil

式展開だけ確認すると

pry(main)> p (/#{keyword}/)
/hoge/&&/uni/
=> /hoge/&&/uni/

となり、「/」の前に「\」のエスケープシーケンスが挿入され、matchがnilになります。

こちら式展開が
(/#{keyword}/) => (/hoge/&&/ika/)

とするのはどのようにすればよいのでしょうか。

お手数ですがお知恵を拝借いただけないでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yuba

2015/09/25 03:33

タグに「正規表現」を追加するといいと思います。
teru

2015/09/28 16:03

yubaさん、アドバイスありがとうございます。
guest

回答5

0

line.match(/hoge/&&/ika/)
とすればマッチする。

他の方の指摘のある通り、これが間違っているので、質問のそれ以降が無意味になっています。

「空白で区切られた文字列が全て含まれるかどうか?」を判断したいなら、

Ruby

1line = "・・・・・・・" 2words = "・・・・・・・" 3p words.split.all? {|word| line.include?(word)} # 文字列として比較する場合 4p words.split.all? {|word| Regexp.new(word) =~ line} # 正規表現としてマッチさせる場合

投稿2015/09/25 04:02

otn

総合スコア84529

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

teru

2015/09/28 16:16

otnさん、コメントありがとうございます。最終的には「正規表現としてマッチさせる場合」に修正となりました。
guest

0

rifuch様の回答とp-chan様の回答にコメントしましたが、任意の数のキーワードが含まれていることを正規表現で記述するときには肯定先読みを使うのがよろしいかと思います。

ruby

1line.match(/(?=hoge)(?=ika)./)

これがhogeもしくはikaを含むことの正規表現です。

投稿2015/09/25 03:33

yuba

総合スコア5568

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

rifuch

2015/09/25 04:46

エレガントですね!
otn

2015/09/30 05:46

/(?=.*hoge)(?=.*ika)/ では? あと、 > これがhogeもしくはikaを含むことの正規表現です。 「かつ」ですね。
yuba

2015/09/30 08:38

その通りでした。ご指摘ありがとうございます。
guest

0

ベストアンサー

個別に判定して、あとから判定結果を評価するのはいかがでしょうか
(検索したいキーワードの前後関係を気にせず探せます)

ruby

1line = 'hoge tako ika ikura uni ebi kani' 2keywords = 'uni kani' 3 4p regexp_keywords = keywords.split.map { |keyword| Regexp.new(keyword) } 5# => [/uni/, /kani/] 6p result = regexp_keywords.map { |keyword| line.match(keyword) } 7# => [#<MatchData "uni">, #<MatchData "kani">] 8p result.include?(nil) 9# => false

この方法であれば、String#include? でも同様のことができます

ruby

1p keywords.split.map { |keyword| line.include?(keyword) }.include?(nil) 2# => false

何か参考になれば幸いです

Links

投稿2015/09/25 01:55

gouf

総合スコア2321

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

teru

2015/09/28 16:08

Rebexpクラスを利用する方法を知りませんでした。この方法で進めていきます。 ありがとうございました。
guest

0

このようにすれば、一応はマッチさせることができます。正当な方法かどうかは分かりませんが…

p line.match(/#{keyword}/) ⇒ nil ↓↓↓ p eval("line.match(/#{keyword}/)") ⇒ #<MatchData "uni">

<追記>

それと、rifuchさんのご指摘のように、/hoge/&&/ika/ では想定通りにマッチしないと私も思います。
それで、下記のような方法をご提案します。

keyword = "(" + word.gsub(/\s/, ').+(') + ")" p keyword  ⇒ "(hoge).+(uni)" p line.match(/#{keyword}/)  ⇒ <MatchData "hoge tako ika ikura uni" 1:"hoge" 2:"uni">

投稿2015/09/24 19:48

編集2015/09/24 19:58
pi-chan

総合スコア5936

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yuba

2015/09/25 01:01

追記の方法だと、キーワードが指定順に出てくることに対してマッチしていまいますが、微妙に要望と異なっている気がします。
guest

0

本当にline.match(/hoge/&&/ika/)で、'hoge'と'ika'両方が含まれている文字列にマッチしますか?
この場合、式 /hoge/ && /ika/ が展開された結果の /ika/ が評価されて、
結果的にline.match(/ika/)を実行した結果が帰ってくると思うのですが。

Ruby

1line = "hoge tako ika ikura uni ebi kani" 2 3line.match(/hoge/&&/ika/) 4# => #<MatchData "ika"> /ika/しか判定していない 5/hoge/&&/ika/ 6# => /ika/ 7 8# 上記 hoge uniの両方が入ってるかを判定 9line.match(/hoge.*uni|uni.*hoge/) 10# => #<MatchData "hoge tako ika uni"> 11word = 'hoge uni' 12split_word = word.split(' ') 13search_word = /#{split_word.join('.*')}|#{split_word.reverse.join('.*')/ 14# => /hoge.*uni|uni.*hoge/ 15line.match(search_word) 16# => #<MatchData "hoge tako ika uni">

投稿2015/09/24 19:08

rifuch

総合スコア1901

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yuba

2015/09/25 00:59

検索ワードが2つならそれで良さそうですが、2つには限られていないようです。3つ以上だと組み合わせが急増しますが大丈夫ですかね。
rifuch

2015/09/25 04:45

yubaさんが回答されているとおり、肯定先読みを行うのが正しいですよね! 正規表現を考える手間を惜しんで、簡単な方法を採っていました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問