###前提・実現したいこと
Railsでスクレイピングの練習をしているのですが、twitterのようにページ下部で無限スクロールするサイトでツイートのテキストを拾おうとすると最初の20件しかスクレイピングできません。そこで色々とネットで調べてInfinite Scrollという仕組みがあるなどの情報まではわかったのですが、具体的にRailsでスクレイピングプログラムに落とし込むことができておりません。Infinite Scroll以外も含めて無限スクロールサイトをRailsでスクレイピング可能にする具体的な良い方法はないでしょうか?
###該当のソースコード
def
1 agent = Mechanize.new 2 agent.user_agent_alias = "Mac Safari" 3 page = agent.get("https://twitter.com/ユーザー名") 4 texts = page.search('.js-tweet-text-container') 5 texts.each do |numbers| 6 text = numbers.search('p').inner_text 7 tweets = Tweet.where(text: text).first_or_initialize 8 tweets.save 9 end 10 11 end
###試したこと
Google chromeの検証モードでスクロールをして画面下まで行くとHTML上で新しいツイートのリストが増えたのを確認しましたが、その仕組みまではよく分かりませんでした。
###補足情報(言語/FW/ツール等のバージョンなど)
言語: Ruby on Rails(2.1.3)
OS: MAC OS X EL Capitan(10.11.5)
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/09/01 03:53