回答編集履歴

2

補足を追加

2021/02/26 12:21

投稿

Daregada
Daregada

スコア11990

test CHANGED
@@ -1,4 +1,4 @@
1
- Windowsでリダイレクトを使うと、標準出力のエンコードの既定値がcp932になります。今回得られるテキスト中に著作権マーク© (U+00A9)が含まれており、cp932では表現できない文字なので、リダイレクトしたときにだけエラーが表示されます。
1
+ Windowsでリダイレクトを使うと、Pythonの標準出力のエンコードの既定値がcp932になります。今回得られるテキスト中に著作権マーク© (U+00A9)が含まれており、cp932では表現できない文字なので、リダイレクトしたときにだけエラーが表示されます。
2
2
 
3
3
 
4
4
 
@@ -21,3 +21,17 @@
21
21
  補足: 書いた後で見つかる同じ内容の質問。
22
22
 
23
23
  [Python - Pythonでエンコードのエラーです。|teratail](https://teratail.com/questions/268749)
24
+
25
+
26
+
27
+ さらに補足: Python 3.7以降で使える`-X utf8`オプションを使うと、標準出力のエンコードの既定値がutf-8になるので、上記のコードが不要になります。環境変数`PYTHONUTF8`に1を設定しても、同じ効果が得られます。
28
+
29
+
30
+
31
+ ```Diff
32
+
33
+ -C:¥Users>python requests_header_encoding.py https://yahoo.co.jp/dp > dp.html
34
+
35
+ +C:¥Users>python -X utf8 requests_header_encoding.py https://yahoo.co.jp/dp > dp.html
36
+
37
+ ```

1

補足を追加

2021/02/26 12:21

投稿

Daregada
Daregada

スコア11990

test CHANGED
@@ -15,3 +15,9 @@
15
15
 
16
16
 
17
17
  この後でprintしたものをリダイレクトすれば、utf-8でエンコードされたファイルが作成されます。
18
+
19
+
20
+
21
+ 補足: 書いた後で見つかる同じ内容の質問。
22
+
23
+ [Python - Pythonでエンコードのエラーです。|teratail](https://teratail.com/questions/268749)