rubyを使ってスクレイピングがしたいのnokogiriというライブラリを使っています。
xpathを指定して
[#<Nokogiri::XML::Attr:0x111d108 name="href" value="/lpereira/lwan">]
このようなオブジェクトは取得できたのですが、ここからvalueにある文字列を取得する方法がわかりません。
require
1require 'open-uri' 2 3 4 5 6url = 'https://github.com/trending' 7 8charset = nil 9html = open(url) do |f| 10 charset = f.charset 11 f.read 12end 13 14 15doc = Nokogiri::HTML.parse(html, nil, charset) 16 17 18doc.xpath('//li[@class="col-12 d-block width-full py-4 border-bottom"]').each do |node| 19 p node.xpath('//h3/a/@href') 20end
こちらがコードになります。
スクレイピングしたいのは
https://github.com/trending
こちらのページです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/07/22 08:29
2018/07/22 08:57
2018/07/22 09:01