質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

解決済

1回答

867閲覧

rubyのmatchメソッドについて

hiroshiga

総合スコア4

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2020/07/26 08:22

# 特定の文字列に囲まれた部分を抜き出してハッシュに保存したいです

現在tableという変数にこのような文字列が入っているのですが、

<table><th>場所</th><td>家</td></tr><tr><th>ナンバー</th><td>〒000-0000</td></tr><tr><th>住所</th><td>東京都</td></tr><tr><th>最寄り駅</th><td>東海道線</td></tr></table>

そこから抜き出して
{"場所"=>"家", "ナンバー"=>"〒000-0000", "住所"=>"東京都", "最寄り駅"=>"東海道線"}

というハッシュを作りたいです。ほとんどどうすればいいか分からなかったので、とりあえず<th></th>に囲まれた部分(場所)を抽出するために

ruby

1th = table.match(/\<th\>(.*)\</th\>/) 2th = th.to_s 3p th

としましたところ出力結果が

<th>場所</th><td>家</td></tr><tr><th>ナンバー</th><td>〒000-0000</td></tr><tr><th>住所</th><td>東京都</td></tr><tr><th>最寄り駅</th><td>東海道線</td></tr> となってしまいました。

そのためどうすれば特定の文字列に囲まれた部分を抜き出して抽出できるか知りたいです。
またもしmatchを使わずに{"場所"=>"家", "ナンバー"=>"〒000-0000", "住所"=>"東京都", "最寄り駅"=>"東海道線"}のようなハッシュを作れるのならばそれについても教えていただけると幸いです。
わかりづらい質問かもしれませんがよろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

(.*) って何でも取り込んでしまいますから、最後の</th>まで取り込んじゃいますね。

</tr><tr> でsplitして<th>場所</th><td>家</td> の組み合わせの配列にし、 それらを/<th>(場所)</th><td>(家)</td>/ して $1,$2を取り出すのはどうでしょう。 配列の最初と最後がちょっと形が代わりますから、そこは考慮して 正規表現くふうしてください `table.split("</tr><tr>"). map{|pair| # <th>場所</th><td>家</td> /<th>(.*)</th><td>(.*)</td>/ =~ pair [$1,$2] }` とすると [["場所","家"],["ナンバー","〒000-0000"],[],[]] が得られるでしょう

投稿2020/07/26 08:39

編集2020/07/26 10:10
winterboum

総合スコア23401

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hiroshiga

2020/07/26 09:52

回答ありがとうございます!正規表現の理解が浅く$1と$2を 同時に抽出する方法が分からなかったため 現在このように進めてみたのですが table = table.split("</tr><tr>") table = table.to_s p table.match(/\<th\>(\S+)\</th\>/) $1と$2を同時に抽出する方法はあるんでしょうか?
hiroshiga

2020/07/26 11:21

ありがとうございます!うまくいきました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問