プログラミング初心者です。
スクレイピングのタイトルタグからの取得について教えていただきたいです。
前提・実現したいこと
下記のようなコードから■のタイトルだけ取得したいです。
<div class="ts-h-search-cassetteTitle"> <a href="/●●●/●●●●/●●●●●/" target="_blank" class="ts-h-search-cassetteTitleMain js-h-search-cassetteTitleMain">■ ■ ■</a> <div class="ts-h-search-cassetteTitleSub">▲▲▲</div> </div>該当のソースコード
下記のコードで試したのですが、■以外に▲も取得されてしまいます。
documents.xpath("//div[@class='ts-h-search-cassetteTitle']").each {|n| companies << n.text.strip.gsub(/(\n\t|\t|\n)/, " ")}
■だけ取得するにはどうしたらいいでしょうか。
よろしくお願いいたします。
試したこと
a hrefからの取得も試してみたのですが、その場合は●●●が取得されてしまい上手くいきませんでした。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/01/04 07:01