回答編集履歴

2

些細

2019/07/11 02:57

投稿

quickquip
quickquip

スコア11063

test CHANGED
@@ -8,13 +8,13 @@
8
8
 
9
9
 
10
10
 
11
- >>> import chardet
11
+ >>> r.apparent_encoding
12
+
13
+ 'Windows-1254'
12
14
 
13
15
 
14
16
 
15
- >>> r.apparent_encoding
17
+ >>> import chardet
16
-
17
- 'Windows-1254'
18
18
 
19
19
 
20
20
 

1

説明追記

2019/07/11 02:57

投稿

quickquip
quickquip

スコア11063

test CHANGED
@@ -12,11 +12,27 @@
12
12
 
13
13
 
14
14
 
15
+ >>> r.apparent_encoding
16
+
17
+ 'Windows-1254'
18
+
19
+
20
+
15
21
  >>> chardet.detect(r.content)
16
22
 
17
23
  {'encoding': 'Windows-1254', 'confidence': 0.3693754690993527, 'language': 'Turkish'}
18
24
 
25
+ ```
19
26
 
27
+ トルコ語に認識されています。
28
+
29
+
30
+
31
+
32
+
33
+ EUCを明に指定してdeocdeしても失敗します。
34
+
35
+ ```plain
20
36
 
21
37
  >>> r.content.decode('euc_jp')
22
38