Python3, visual studio 2015 または2017、読み込んだ日本語ファイルが文字化けする。

Question

###前提・実現したいこと
市販のWindows アプリケーションで作成されたテキストファイルを読み込んでからそのファイルの行を表示すると文字化けしているので、直したい。
日本語ファイルの中身を表示する部分で、
['E\x00:\x00\x00　.... と表示されます。

Python3は日本語も適切にエンコードするみたいな記事を見かけるので、こんな簡単なこともできないのかと絶望的な気分です。

###発生している問題・エラーメッセージ
```
file1.txt
file2.txt
file3.txt
['E\x00:\x00\x00U\x00s\x00e\x00r\x00s\x00\x00A ........
プログラム '[9112] python.exe' はコード -1073741510 (0xc000013a) で終了しました。
```

###該当のソースコード
```Python3

import codecs
filelistname = "TEST_filelist.txt"

f_in = open(filelistname, 'r')

lines = f_in.readlines()

linelist = []

for line in lines:
    newline = line.rstrip('
')
    if newline != '':
        linelist.append(newline)
        print(newline)

for l in linelist :
    f_data = codecs.open(l, 'r',encoding="Shift_JIS", errors = 'ignore')
    lines = f_data.readlines()
    print(lines, end = " ")
```

###試したこと
1.１行目に下記の行を追加してみた。(追加しなくても同じで、utf-8にしても同じ）
# -*- coding:shift-jis -*-

2. codecs.open(...)を使った（使わなくても同じ）

3. encoding をいくつか試した
encoding="Shift_JIS"
encoding="shift-jis"
encoding="UTF_8"
encoding="utf-8"

3. 最終行に下記を追加した
end = " "

###補足情報(言語/FW/ツール等のバージョンなど)
Pythonは初心者です。
Anaconda 5.0.1
Visual Studio 2015, 2017ともに同じ表示です。

Accepted Answer

提示された出力結果から`utf_16`または`utf_16_be`で開けると思われます。
が、念のため入力ファイルのエンコーディングを確認ください。
ちなみに`errors='ignore'`をつけると原因が分かりにくくなるのでつけないほうがよいです。

また` -*- coding:～ -*-`は、**ソースファイル**がどの文字コードで書かれているかを指定するものです。
今回の問題とは直接の関係はありません。
保存されたソースファイルのエンコーディングを確認し、適切に指定してください。
（たしか`VisualStudio`ではデフォルトで`shift_jis`で保存されたと思いますが）


検証コード
```Python
# -*- coding: utf-8 -*-
import codecs
f_data = codecs.open('file1.txt', 'r',encoding="utf_16")
lines = f_data.readlines()
print(lines, end = " ") # ['E:\Users\A
']
f_data.close()
```

file1.txtの内容
先頭BOM(ff fe)付き
```
ff fe 45 00 3a 00 5c 00  55 00 73 00 65 00 72 00   ..E.:..U.s.e.r.
73 00 5c 00 41 00 0d 00  0a 00                     s..A.....
```

Answer

テキストエディタで開いた際、多くの場合、エンコーディングが表示されるので、それを参考にするとよいかと思います。(エンコーディングの扱いに慣れている場合は、バイナリエディタで見た方が原因がはっきり分かりますが・・)
※BOM無しの場合は、ファイルの先頭付近に日本語などが含まれていない場合、ASCII、Shift-JIS、Utf-8等の判定材料が無いので、エンコーディングの判定で失敗する場合もあります。

今回の質問の場合、ファイルを開く`f_in = open(filelistname, 'r')`の段階でエンコードに配慮する必要があるかと思います。

似たようなサンプルが、Stackoverflowなどにありますので、参考にされるとよいかと思います。
[Stackoverflow - Character reading from file in Python](https://stackoverflow.com/questions/147741/character-reading-from-file-in-python)
[Qiita - pythonでUTF8のテキスト処理](https://qiita.com/kanemu@github/items/1080972679c9cb70ebff)

例:　utf-8の場合
`f_in = codecs.open(filelistname, 'r', encoding='utf-8')`
(modeのデフォルトは'r'ですが、説明のために足しておきました)

---
1行目の` -*- coding:shift-jis -*-`は、プログラムのソースファイルのエンコードがShiftJISの場合の設定です。

---
linelist が既に文字化けしていると思いますので、linelistに対して`codecs.open(...)`やなどを試した場合も、結果は変わらないと思います。

参考になれば。

---
追記：
BOM (バイトオーダーマーク)というのは、エンコーディングなどを示すためにファイル先頭に付けるマークで、その並び順でLE (リトルエンディアン)か、BE (ビッグエンディアン)かの判定にも使われます。

問題は、BOMが付いていない場合で、この場合はファイルの先頭付近の内容から、エンコーディングが推測されます。
大雑把に分類すると、
英字が1バイト：ASCII、shift-jis、utf-8など
英字が2バイト：utf-16など
※utf-16などの場合、バイナリエディタなどで見ると、アルファベットの間に0x00が挟まっているかと思います。

0x00～0x7fしか存在しない：ASCII (または shift-jis)
0x81など、0x00～0x7f以外の値が含まれる：shift-jis、utf-8など
※shift-jisの場合は、日本語を2バイトで表す場合の1バイト目など
詳細は文字コード表を参考にするとよいかと思います。

参考：
UCS-2 および UCS-2 とユニコードの関係 https://www.ibm.com/support/knowledgecenter/ja/ssw_i5_54/nls/rbagsucs2.htm

Unicode対応 文字コード表 (と解説) http://ash.jp/code/unitbl21.htm

Python3, visual studio 2015 または2017、読み込んだ日本語ファイルが文字化けする。

-- coding:shift-jis --

関連した質問