回答編集履歴

些細

2019/07/11 02:57

投稿

スコア11357

answer CHANGED Viewed

@@ -3,11 +3,11 @@
 >>> r = requests.get('https://search.rakuten.co.jp/search/keyword/')
->>> import chardet
 >>> r.apparent_encoding
 'Windows-1254'
+>>> import chardet
 >>> chardet.detect(r.content)
 {'encoding': 'Windows-1254', 'confidence': 0.3693754690993527, 'language': 'Turkish'}
 ```

説明追記

2019/07/11 02:57

投稿

スコア11357

answer CHANGED Viewed

@@ -5,9 +5,17 @@
 >>> import chardet
+>>> r.apparent_encoding
+'Windows-1254'
 >>> chardet.detect(r.content)
 {'encoding': 'Windows-1254', 'confidence': 0.3693754690993527, 'language': 'Turkish'}
+```
+トルコ語に認識されています。
+EUCを明に指定してdeocdeしても失敗します。
+```plain
 >>> r.content.decode('euc_jp')
 Traceback (most recent call last):
   File "<stdin>", line 1, in <module>