質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

Q&A

解決済

1回答

637閲覧

ruby スクレイピング parse

simp

総合スコア18

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

1グッド

1クリップ

投稿2018/12/17 08:47

以下のファイルをスクレイピングしようと思いrubyを使いコードを書いていたのですが、

なかなかうまいことできなくて、ここで質問することにしました。

require 'nokogiri' html =<<EOF <html> <div class="row"> <div class="title">タイトル1</div> <div class= "description">解説2</div> </div> <div class="row"> <div class="title">タイトル2</div> <div class="description">解説2</div> </div> <div class="row"> <div class="title">タイトル3</div> <div class="description">解説3</div> </div> </html> EOF doc = Nokogiri.parse(html)

このファイルに以下のようなコードを書きました。

require 'csv' require 'open-uri' title = [] description = [] header = ['title','description'] doc.css('.title').each do |file| title.push(file.text) end doc.css('.description').each do |desc| description.push(desc.text) end CSV.open('scrape.csv', 'w') do |csv| array = [title,description].transpose csv << header array.each do |arr| csv << arr end end

しかし、このコードはrowごとにcsvに入れているため、

項目が一つ亡くなった場合、解説とタイトルが1個ずれることになってしまいます。

rowごとにパースするにはどのようなコードを書けばいいでしょうか?

DrqYuto👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

xpathを利用します

ruby

1require 'nokogiri' 2 3html =<<EOF 4<html> 5<div class="row"> 6<div class="title">タイトル1</div> 7<div class= "description">解説2</div> 8</div> 9<div class="row"> 10<div class="title">タイトル2</div> 11<div class="description">解説2</div> 12</div> 13<div class="row"> 14<div class="title">タイトル3</div> 15<div class="description">解説3</div> 16</div> 17</html> 18EOF 19 20 21doc = Nokogiri::HTML.parse(html) 22 23doc.xpath('//div[@class="row"]').each do |row| 24 puts row.xpath('div').map { |e| '"' + e.text + '"' }.join(', ') 25end 26

csv

1"タイトル1", "解説2" 2"タイトル2", "解説2" 3"タイトル3", "解説3"

投稿2018/12/17 12:33

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問