teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

修正

2016/02/23 15:53

投稿

NCC1701
NCC1701

スコア1683

answer CHANGED
@@ -6,12 +6,15 @@
6
6
  f.read
7
7
  end
8
8
  ```
9
-
10
- `StringIO`が`OpenURI::Meta`モジュールで拡張されているのですが,`OpenURI::Meta`リファレンスによると以下のように記述されています。
9
+ `OpenURI::Meta`リファレンスによると以下のように記述されています。
11
10
  ```ruby
12
11
  charset -> String | nil
13
12
  charset { ... } -> String
14
13
  ```
14
+ なのでnilが代入されてませんか?ちなみに`doc = Nokogiri::HTML.parse(html)`だけだと,不都合があるのでしょうか?
15
+
15
- コードの問題ではなく読み込むurlのソースに問題がありそうです。
16
+ おそらくコードの問題ではなく読み込むurlのソースに問題がありそうです。対症療法的ですが,
16
17
  `charset = f.charset||charset`
17
- あたりで逃げてみるというのも手かもしれません。対症療法的ですが。
18
+ あたりで逃げてみるというのも手かもしれません。
19
+
20
+ 自分の経験からスクレイピングで厄介なのは,こちら側のコードの問題より,スクレイピング先のhtmlコードに問題がある場合でした。