プログラミングは初心者です
rubyのnokogiriを使ってスクレイピングをしているのですが、今複数のサイトのトップページにある文字の数を調べています。
ruby
1require 'nokogiri' 2require 'open-uri' 3 4url = "http://www.xxxxxxxxxxxxx" 5 6charset = nil 7html = open(url) do |f| 8 charset = f.charset 9 f.read 10end 11 12doc = Nokogiri::HTML.parse(html, nil, 'utf-8') 13txt = doc.css("body").text 14puts txt.length
現在このようなスクリプトで一つ一つそのサイトのbody部分(普通にサイトを閲覧して私たちの目に見えるところ)にある文字の数を調査しています。
この"http://www.xxxxxxxxxxxxx"部分を一回一回地道に変えずに、複数のurlを指定して一気に取得する方法はないでしょうか。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。