###発生している問題・エラーメッセージ
サイトから文字列を取得したいのですが特定の文字がうまく取得できません。
そのサイトのソースコードにはcharset=utf-8とあります。
utf-8としてNokogiriでパースしたのですが、
\(^-^)/ や (´,,・ω・,,`) といった文字列を含んでいると、それ以降の文字を読み込んでくれません。
何か対応策はないでしょうか。。
###該当のソースコード
charset = "utf-8" html = open(url) do |f| f.read end doc = Nokogiri::HTML.parse(html, nil, charset)
特定の文字列を含んでいなければ問題がないのですが、その文字列があるとうまくいかないのです。
###使用している環境
ruby 2.3.1p112 (2016-04-26 revision 54768) [x86_64-darwin15]
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/02/24 01:51