回答編集履歴

誤字修正

2020/04/26 23:36

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -90,4 +90,4 @@
 $ LANG=ja_JP.UTF-8 python3 test.py
 ```
-大分長くなりましたが、encode() decode()は必要最小限にし、Pythonの外の世界とやりとりする時にだけ使うようにします。例えばSTDOUTにprintしたりでディスクの読み書きやネットワーク、popen(),system()などで外部コマンドを呼び出す時が外の世界になります。その時だけエンコードに注意しましょう。Pythonの内側では、出来る限り文字列はUnicodeオブジェクトのまま、バイト列はbytesのままにすれば、うまく行くようにPythonのライブラリが設計されているからです。今回のファイル名も外界になることは盲点で、僕も勉強になりました。
+大分長くなりましたが、encode() decode()は必要最小限にし、Pythonの外の世界とやりとりする時にだけ使うようにします。例えばSTDOUTにprintしたりディスクの読み書きやネットワーク、popen(),system()などで外部コマンドを呼び出す時が外の世界になります。その時だけエンコードに注意しましょう。Pythonの内側では、出来る限り文字列はUnicodeオブジェクトのまま、バイト列はbytesのままにすれば、うまく行くようにPythonのライブラリが設計されているからです。今回のファイル名も外界になることは盲点で、僕も勉強になりました。

コメント追加

2020/04/26 23:35

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -1,11 +1,11 @@
-手っ取り早くは、次の行を
+次の行を
 ```Python3
     f = open("日本語のファイル名000.csv", 'a',newline = "" ,encoding='utf-8')
 ```
-次のように変更して、ファイル名のエンコーディングを明示的に指定します。これで動くと思いますし、環境依存にさせないためには、むしろ積極的に指定する方が安全かもしれません。
+次のように変更して、ファイル名のエンコーディングを明示的に指定します。これで動くと思いますし、環境依存にさせないためには、むしろ積極的に指定する方が安全です。
 ```Python3
     f = open("日本語のファイル名000.csv".encode('utf-8'), 'a',newline = "" ,encoding='utf-8')
@@ -88,4 +88,6 @@
 ```bash
 $ LANG=ja_JP.UTF-8 python3 test.py
-```
+```
+大分長くなりましたが、encode() decode()は必要最小限にし、Pythonの外の世界とやりとりする時にだけ使うようにします。例えばSTDOUTにprintしたりでディスクの読み書きやネットワーク、popen(),system()などで外部コマンドを呼び出す時が外の世界になります。その時だけエンコードに注意しましょう。Pythonの内側では、出来る限り文字列はUnicodeオブジェクトのまま、バイト列はbytesのままにすれば、うまく行くようにPythonのライブラリが設計されているからです。今回のファイル名も外界になることは盲点で、僕も勉強になりました。

誤字

2020/04/26 20:06

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -44,7 +44,7 @@
 POSIX
 ```
-ちなみに端末の環境は次の通り。日本語の設定するとログイン環境によってエラーメッセージが日本語になったり、英語になったり煩雑ですし、環境依存の問題かも？と悩む可能性が一つ増えるので英語のままにしています。これで困ったことはありません。
+ちなみに端末の環境は次の通り。日本語の設定をするとログイン環境によってエラーメッセージが日本語になったり、英語になったり煩雑ですし、環境依存の問題かも？と悩む可能性が一つ増えるので英語のままにしています。これで困ったことはありません。
 ```bash
 $ locale

説明を追加。くどいかも。

2020/04/26 19:46

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -65,7 +65,7 @@
 LC_ALL=
 ```
-言語はen_USでもエンコーディングはUTF-8なので、試してみるとうまくいきます。
+言語はen_USでもエンコーディングはUTF-8なので、修正前のコードを試してみるとうまくいきます。
 ```bash
@@ -74,7 +74,7 @@
 test.py  日本語のファイル名000.csv
 ```
-僕の環境では存在しないロケールja_JP.UTF-8で試すと同じエラーがおきます。
+僕の環境では存在しないロケールja_JP.UTF-8で修正前のコードを試すと同じエラーがおきます。
 ```bash
 $ LANG=ja_JP.UTF-8 python3 test.py
@@ -82,4 +82,10 @@
   File "test.py", line 8, in <module>
     f = open("\u65e5\u672c\u8a9e\u306e\u30d5\u30a1\u30a4\u30eb\u540d000.csv", 'a',newline = "" ,encoding='utf-8')
 UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-8: ordinal not in range(128)
+```
+.encode('utf-8')を追加した修正後のコードであれば、存在しないロケールを無理やり指定してもエラーになりません。
+```bash
+$ LANG=ja_JP.UTF-8 python3 test.py
 ```

書式の改善？

2020/04/26 19:45

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -44,7 +44,7 @@
 POSIX
 ```
-ちなみに端末の環境は次の通り。
+ちなみに端末の環境は次の通り。日本語の設定するとログイン環境によってエラーメッセージが日本語になったり、英語になったり煩雑ですし、環境依存の問題かも？と悩む可能性が一つ増えるので英語のままにしています。これで困ったことはありません。
 ```bash
 $ locale
@@ -65,7 +65,7 @@
 LC_ALL=
 ```
-言語はen_USでもエンコーディングはUTF-8なので、試してみるとうまくいきます。日本語の設定するとログイン環境によってエラーメッセージが日本語になったり、英語になったり煩雑ですし、環境依存の問題かも？と悩む可能性が一つ増えるので英語のままにしています。これで困ったことはありません。
+言語はen_USでもエンコーディングはUTF-8なので、試してみるとうまくいきます。
 ```bash

正しいコマンドに変更

2020/04/26 19:39

投稿

退会済みユーザー

スコア0

answer CHANGED Viewed

@@ -12,27 +12,62 @@
 ```
-僕の最初のコメントの提案がうまく行かなかった理由はおそらくja_JP.UTF-8ロケールが存在しないためです。次のコマンドを僕の環境で実行するとen_US.UTF-8しかありません。Ubuntuを日本語の設定なしでインストールすると多分同じ結果になると思います。
+僕の最初のコメントの提案がうまく行かなかった理由はおそらくja_JP.UTF-8ロケールが存在しないためです。locale -aコマンドを僕の環境で実行するとja_JP.UTF-8はありません。Ubuntuを日本語の設定なしでインストールすると多分同じ結果になると思います。
 ```bash
-grep -v ^# /etc/locale.gen
+$ locale -a
+C
+C.UTF-8
+en_AG
+en_AG.utf8
+en_AU.utf8
+en_BW.utf8
+en_CA.utf8
+en_DK.utf8
+en_GB.utf8
+en_HK.utf8
+en_IE.utf8
+en_IL
+en_IL.utf8
+en_IN
+en_IN.utf8
+en_NG
+en_NG.utf8
+en_NZ.utf8
+en_PH.utf8
+en_SG.utf8
-en_US.UTF-8 UTF-8
+en_US.utf8
+en_ZA.utf8
+en_ZM
+en_ZM.utf8
+en_ZW.utf8
+POSIX
 ```
 ちなみに端末の環境は次の通り。
 ```bash
-$ echo $LANG
+$ locale
-en_US.UTF-8
+LANG=en_US.UTF-8
-$ env | grep LC_
+LANGUAGE=
-LC_TERMINAL=iTerm2
+LC_CTYPE="en_US.UTF-8"
+LC_NUMERIC="en_US.UTF-8"
-LC_TERMINAL_VERSION=3.3.9
+LC_TIME="en_US.UTF-8"
+LC_COLLATE="en_US.UTF-8"
+LC_MONETARY="en_US.UTF-8"
+LC_MESSAGES="en_US.UTF-8"
+LC_PAPER="en_US.UTF-8"
+LC_NAME="en_US.UTF-8"
+LC_ADDRESS="en_US.UTF-8"
+LC_TELEPHONE="en_US.UTF-8"
+LC_MEASUREMENT="en_US.UTF-8"
+LC_IDENTIFICATION="en_US.UTF-8"
+LC_ALL=
 ```
-言語はen_USでもエンコーディングはUTF-8なので、試してみるとうまくいきます。
+言語はen_USでもエンコーディングはUTF-8なので、試してみるとうまくいきます。日本語の設定するとログイン環境によってエラーメッセージが日本語になったり、英語になったり煩雑ですし、環境依存の問題かも？と悩む可能性が一つ増えるので英語のままにしています。これで困ったことはありません。
 ```bash
 $ LANG=en_US.UTF-8 python3 test.py
 $ ls