回答編集履歴

1

問題に直接関係しないと思われる記述を削除

2018/11/02 23:50

投稿

morinatsu
morinatsu

スコア395

test CHANGED
@@ -1,12 +1,4 @@
1
1
  Pythonの処理を始める以前の、wiki_wakati.txtの時点で、既にファイルが壊れている(≒正しいBOM無しUTF-8でない)と想像します。
2
-
3
-
4
-
5
- > ソースコード内のwiki-wakati.txtの文字コードをEmacsで確認したところ、文字コードはBOM無しUTF-8になっているのですが、
6
-
7
-
8
-
9
- テキストファイル中の文字コードは自明ではありません。そのためテキストエディタはファイルの一部を読み取り、既知の文字コードをいろいろ当てはめて試し読みして、たまたまハマったものを採用する……というようなことをやっています。
10
2
 
11
3
 
12
4