テキストファイルを作り、pythonで読み込みバイト数を調べました。しかし、最初の一行に謎の見えない3バイトが付いてしまいます。この正体は何でしょうか?消し方も教えてください。
windows7,Anaconda,Spyder,python2を使っています。
文字コードや改行コードについてはあまりよく分かっていません。関係あるか分かりませんが。
test.txt(UTF-8,CR+LFで保存)
あいうえお かきくけこ さしすせそ
test.py
# -*- coding: utf-8 -*- f = open('test.txt', 'r') f_read = f.read().split('\n') for i in f_read: print i, len(i)
実行結果
あいうえお 18 かきくけこ 15 さしすせそ 15
このように日本語は一文字3バイトのはずですが、「あいうえお」だけ3バイト余計です。分かる方よろしくお願いいたします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。