回答編集履歴
2
些細
test
CHANGED
@@ -8,13 +8,13 @@
|
|
8
8
|
|
9
9
|
|
10
10
|
|
11
|
-
>>>
|
11
|
+
>>> r.apparent_encoding
|
12
|
+
|
13
|
+
'Windows-1254'
|
12
14
|
|
13
15
|
|
14
16
|
|
15
|
-
>>> r
|
17
|
+
>>> import chardet
|
16
|
-
|
17
|
-
'Windows-1254'
|
18
18
|
|
19
19
|
|
20
20
|
|
1
説明追記
test
CHANGED
@@ -12,11 +12,27 @@
|
|
12
12
|
|
13
13
|
|
14
14
|
|
15
|
+
>>> r.apparent_encoding
|
16
|
+
|
17
|
+
'Windows-1254'
|
18
|
+
|
19
|
+
|
20
|
+
|
15
21
|
>>> chardet.detect(r.content)
|
16
22
|
|
17
23
|
{'encoding': 'Windows-1254', 'confidence': 0.3693754690993527, 'language': 'Turkish'}
|
18
24
|
|
25
|
+
```
|
19
26
|
|
27
|
+
トルコ語に認識されています。
|
28
|
+
|
29
|
+
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
EUCを明に指定してdeocdeしても失敗します。
|
34
|
+
|
35
|
+
```plain
|
20
36
|
|
21
37
|
>>> r.content.decode('euc_jp')
|
22
38
|
|