質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

1回答

1414閲覧

rubyでnokogiri

kamatmt

総合スコア25

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

0グッド

0クリップ

投稿2016/01/18 05:13

更新されるwebページの情報繰り返し取得したいと考えています。
下記のコードですと20回繰り返しても10個までの情報しか取得できません。
理由もわからず困っています。解決策をお願いします。
また、出力方法は行に隙間なく出力したいです。

ruby

1# -*- coding: utf-8 -*- 2require 'nokogiri' 3require 'open-uri' 4require "kconv" 5 6doc = Nokogiri::HTML(open('http://realtime.search.yahoo.co.jp/search?lz=1&ei=UTF-8&rkf=1&ch=8')) 7File.open("write.txt", "w:UTF-8") do |f| 8 a = [] 9for i in 1..20 do 10 x = doc.xpath("//*[@id='TSm']/div[#{i}]/h2/text()") 11 12 y = a.push(x) 13 end 14z = y.uniq 15 f.puts z 16 17end

出力結果の例
aa
bb
cc
...

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

HTMLには、10件分しか出ていないので、10件しか無理です。それ以上の分は、JavaScriptで追加されているようです。

また、出力方法は行に隙間なく出力したいです。

x = doc.xpath("//*[@id='TSm']/div[#{i}]/h2/text()").text.strip
でどうでしょうか。stripで前後の空白文字(改行とか)を削除します。

投稿2016/01/18 12:30

otn

総合スコア84505

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問