http://crawler.sbcr.jp/samplepage.html
ここから情報を抽出したいと考えています。
ruby
1 2# -*- coding: utf-8 -*- 3 4page_source = open("samplepage.html", &:read) 5 6dates = page_source.scan(%r!(\d+)年 ?(\d+)月 ?(\d+)日<br />!) 7dates[0,4] 8 9url_titles = page_source.scan(%r!^<a href="(.+?)">(.+?)</a><br />!) 10url_titles[0,4] 11 12dates.length 13url_titles.length
6:in scan': invalid byte sequence in US-ASCII (ArgumentError) from tweet3.rb:6:in
<main>'
というエラーがでます。解決策をお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。