回答編集履歴

Windowsと合わない説明を修正

2017/01/05 08:07

投稿

ikedas

スコア4441

answer CHANGED Viewed

@@ -1,24 +1,31 @@
-Pythonを起動する前に[PYTHONIOENCODING](http://docs.python.jp/3/using/cmdline.html#envvar-PYTHONIOENCODING)環境変数を設定します。
+(Windowsと合わない説明を修正しました)
+コマンドプロンプトで端末の文字コードをUTF-8にするには、次のようにします。
-```bash
+```
+> chcp 65001
+```
+Pythonの入出力の文字コードを変えるには、Pythonを起動する前に[PYTHONIOENCODING](http://docs.python.jp/3/using/cmdline.html#envvar-PYTHONIOENCODING)環境変数を設定します。
+```
-$ PYTHONIOENCODING=cp932
+> PYTHONIOENCODING=utf-8
-$ export PYTHONIOENCODING
-$ python ...
+> python ...
 ...
 ```
-ただ、これだと標準入出力の全部 (`sys.stdin.encoding`、`sys.stdout.encoding`、`sys.stderr.encoding`) が変わってしまいます。どれか一つだけ (たとえば`sys.stdout.encoding`だけ) 変える場合は、
+ちなみに、上記の方法だと標準入出力の全部 (`sys.stdin.encoding`、`sys.stdout.encoding`、`sys.stderr.encoding`) が変わります。どれか一つだけ (たとえば`sys.stdout.encoding`だけ) 変える場合は、
 ```python
 import codecs
 import sys
 # Python 2.x
-sys.stdout = codecs.getwriter("cp932")(sys.stdout)
+sys.stdout = codecs.getwriter("utf-8")(sys.stdout)
 print u'あい' # bytes型ではだめ
 # Python 3.x
-sys.stdout = codecs.getwriter("cp932")(sys.stdout.detach())
+sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())
 print('あい')
 ```

微修正

2017/01/05 08:07

投稿

ikedas

スコア4441

answer CHANGED Viewed

@@ -26,6 +26,6 @@
 Python 3では、文字列に特定の文字コードが指定されることはありません。Python内部では、文字データはすべてユニコードで扱われます。
-文字データを実際にファイルに保存したり通信回線で送ったりするときは、バイトデータに変換してやる必要があります。つまり、Pythonの外では文字はバイト型のデータで表されます。文字とバイトの間の変換ルールを文字コードと言います。文字コードには「UTF-8」や「CP932」などのいろいろな種類があります。
+文字データを実際にファイルに保存したり通信回線で送ったりするときは、バイトデータに変換してやる必要があります。つまり、Pythonの**外部**では文字はバイト型のデータで表されます。文字とバイトの間の変換ルールを文字コードと言います。文字コードには「UTF-8」や「CP932」などのいろいろな種類があります。
 `sys.stdout.encoding`を変えるということは、`print()`で文字を出力するときにどの文字コードのバイトデータにするかを変える、ということです。出力先の端末 (画面) で想定している文字コードと違えば、正しく表示されません。例えば、端末の文字コードがUTF-8のときに`sys.stdout.encoding`をCP932にすれば、表示されるものは文字化けします。

追記文字コード

2017/01/05 07:36

投稿

ikedas

スコア4441

answer CHANGED Viewed

@@ -21,3 +21,11 @@
 sys.stdout = codecs.getwriter("cp932")(sys.stdout.detach())
 print('あい')
 ```
+(追記)
+Python 3では、文字列に特定の文字コードが指定されることはありません。Python内部では、文字データはすべてユニコードで扱われます。
+文字データを実際にファイルに保存したり通信回線で送ったりするときは、バイトデータに変換してやる必要があります。つまり、Pythonの外では文字はバイト型のデータで表されます。文字とバイトの間の変換ルールを文字コードと言います。文字コードには「UTF-8」や「CP932」などのいろいろな種類があります。
+`sys.stdout.encoding`を変えるということは、`print()`で文字を出力するときにどの文字コードのバイトデータにするかを変える、ということです。出力先の端末 (画面) で想定している文字コードと違えば、正しく表示されません。例えば、端末の文字コードがUTF-8のときに`sys.stdout.encoding`をCP932にすれば、表示されるものは文字化けします。

typos\.

2017/01/05 07:35

投稿

ikedas

スコア4441

answer CHANGED Viewed

@@ -14,10 +14,10 @@
 import sys
 # Python 2.x
-sys.stdout = codecs.getwriter("utf-8")(sys.stdout)
+sys.stdout = codecs.getwriter("cp932")(sys.stdout)
 print u'あい' # bytes型ではだめ
 # Python 3.x
-sys.stdout = codecs.getwriter("utf-8")(sys.stdout.detach())
+sys.stdout = codecs.getwriter("cp932")(sys.stdout.detach())
 print('あい')
 ```