###該当のソースコード
class CrawlersController < ApplicationController require 'anemone' def index urls = [] urls.push("http://www.amazon.co.jp/gp/bestsellers/books/466284/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/571582/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/492152/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/466286/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/466282/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/492054/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/466290/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/492166/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/466298/") urls.push("http://www.amazon.co.jp/gp/bestsellers/books/466294/") Anemone.crawl(urls) do |anemone| anemone.on_every_page do |page| ~~~ end end end
一つのサイトの違うページであればこのような感じでクローリングをすればいいのかもしれないのですが、全く別の数百のサイトから全く違うxpath,cssセレクタでクローリングをする場合、どのように記述をしていけば効率よく、修正も楽なコードが書けるのでしょうか?アドバイスをお願いしたいです。
該当のページをクロールし、特定の場所をスクレイピングし、mysqlに保存。
次にクロールをした時に内容が変わっていたら変わった部分をビューに表示させたいと思っています。
それとそもそもControllerに書くので大丈夫なのでしょうか?
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。