以下のファイルをスクレイピングしようと思いrubyを使いコードを書いていたのですが、
なかなかうまいことできなくて、ここで質問することにしました。
require 'nokogiri' html =<<EOF <html> <div class="row"> <div class="title">タイトル1</div> <div class= "description">解説2</div> </div> <div class="row"> <div class="title">タイトル2</div> <div class="description">解説2</div> </div> <div class="row"> <div class="title">タイトル3</div> <div class="description">解説3</div> </div> </html> EOF doc = Nokogiri.parse(html)
このファイルに以下のようなコードを書きました。
require 'csv' require 'open-uri' title = [] description = [] header = ['title','description'] doc.css('.title').each do |file| title.push(file.text) end doc.css('.description').each do |desc| description.push(desc.text) end CSV.open('scrape.csv', 'w') do |csv| array = [title,description].transpose csv << header array.each do |arr| csv << arr end end
しかし、このコードはrowごとにcsvに入れているため、
項目が一つ亡くなった場合、解説とタイトルが1個ずれることになってしまいます。
rowごとにパースするにはどのようなコードを書けばいいでしょうか?
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。