やりたいこと
Railsでアプリケーションを作成しています。
そこでスクレイピングでDBに保存ということをしたいです。
参考にした記事
Nokogiriを使ったRubyスクレイピング [初心者向けチュートリアル]
解決したいこと
上記の記事で「 (6) NaverまとめTechページの注目一覧のタイトル・画像を取得」という例がありました。
ruby
1require 'open-uri' 2require 'nokogiri' 3 4# スクレイピング先のURL 5url = 'http://matome.naver.jp/tech' 6 7charset = nil 8html = open(url) do |f| 9 charset = f.charset # 文字種別を取得 10 f.read # htmlを読み込んで変数htmlに渡す 11end 12 13# htmlをパース(解析)してオブジェクトを作成 14doc = Nokogiri::HTML.parse(html, nil, charset) 15 16doc.xpath('//li[@class="mdTopMTMList01Item"]').each do |node| 17 # tilte 18 p node.css('h3').inner_text 19 20 # 記事のサムネイル画像 21 p node.css('img').attribute('src').value 22 23 # 記事のサムネイル画像 24 p node.css('a').attribute('href').value 25end
疑問
①このファイルをどこのディレクトリに作成すればいいのかわからない。
②WEBアプリケーションで複数のページに表示されているテキストをスクレイピングする書き方がわからない。
③DBに保存する方法をしりたい。
詳しい方、宜しくお願い致します。
回答1件
あなたの回答
tips
プレビュー