質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

1回答

419閲覧

rubyでnokogiri・xpathの使い方

kamatmt

総合スコア25

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

1クリップ

投稿2018/01/22 10:00

更新されるwebページの情報繰り返し取得したいと考えています。
//[@id='TSm']/div[#{i}]/h2/text() の部分は本文を取得し、
//
[@id='TSm']/div[#{i}]/h2/a の部分でハッシュタグやurlを取得しています。

ここで、ハッシュタグのみを取得するためにはどのようにすればよいでしょうか?
よろしくお願いします。

ruby

1# -*- coding: utf-8 -*- 2require 'nokogiri' 3require 'open-uri' 4require "kconv" 5 6doc = Nokogiri::HTML(open('http://realtime.search.yahoo.co.jp/search?lz=1&ei=UTF-8&rkf=1&ch=8')) 7File.open("write.txt", "w:UTF-8") do |f| 8 a = [] 9for i in 1..10 do 10 x = doc.xpath("//*[@id='TSm']/div[#{i}]/h2/text()","//*[@id='TSm']/div[#{i}]/h2/a") 11 12 y = a.push(x) 13 end 14 f.puts y 15 16end

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

下記ではいかがでしょうか。
ハッシュタグとして"#"で始まるテキストを抽出しており、本文の取得部分は省略しています。

ruby

1# -*- coding: utf-8 -*- 2require 'nokogiri' 3require 'open-uri' 4require "kconv" 5 6doc = Nokogiri::HTML(open('https://search.yahoo.co.jp/realtime/search?lz=1&ei=UTF-8&rkf=1&ch=8')) 7a = [] 8File.open("write.txt", "w:UTF-8") do |f| 9 for i in 1..10 do 10 doc.xpath("//*[@id='TSm']/div[#{i}]/h2/a").each do |x| 11 a.push x.children[0].text if x.children[0].text =~ /^#/ 12 end 13 end 14 f.puts a 15end

投稿2018/01/23 05:18

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問