このサイトのスクレイピングコードを参考にスクレイピングをしていたのですが、以下のコードについて質問があります。
require 'open-uri' require 'nokogiri' # スクレイピング先のURL url = 'http://ad-navi.sendenkaigi.com/actor_company/' charset = nil html = open(url) do |f| charset = f.charset # 文字種別を取得 f.read # htmlを読み込んで変数htmlに渡す end # htmlをパース(解析)してオブジェクトを作成 doc = Nokogiri::HTML.parse(html, nil, charset) doc.xpath('//div[@class="corp_data2"]').each do |node| p node.css('p[1]').inner_text p node.css('p.right.nomal').inner_text.match(/[0-9]+人/).to_s.to_i p node.css('dl[3]/dd').inner_text end
なぜxpathとcssに分けて書いたのでしょうか?そうするメリットは何かあるのでしょうか?
(ちなみに、どちらもcssでしてしても動きました)
doc.xpath('//div[@class="corp_data2"]').each do |node| p node.css('p[1]').inner_text p node.css('p.right.nomal').inner_text.match(/[0-9]+人/).to_s.to_i p node.css('dl[3]/dd').inner_text
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/09/30 10:06