回答率: 85.30%

質問するログイン新規登録

トップに関する質問 unicodedecodeerror

編集履歴

質問編集履歴

1

test

2018/05/01 21:30

投稿

スコア6

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~python3での~~unicodedecodeerror
1	+ unicodedecodeerror

body CHANGED Viewed

@@ -1,65 +1,4 @@
 ###前提・実現したいこと
 pythonでファイルを読み込もうとする際にunicodedecodeerrorが生じるのですが解決方法がわかりません
-###発生している問題・エラーメッセージ
+###発生している問題・エラーメッセージ
-```
-Traceback (most recent call last):
-  File "d2v.py", line 46, in <module>
-    lines = f.readlines()
-  File "/Users/admin/.pyenv/versions/3.5.0/lib/python3.5/codecs.py", line 321, in decode
-    (result, consumed) = self._buffer_decode(data, self.errors, final)
-UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte
-```
-###python
-```ここに言語を入力
-import os
-import sys
-import MeCab
-import collections
-from gensim import models
-from gensim.models.doc2vec import LabeledSentence
-from gensim.models.doc2vec import TaggedDocument
-import codecs
-import MeCab
-from gensim.models import doc2vec
-from gensim.models.doc2vec import Doc2Vec
-#  現在のディレクトリを取得
-root_dir = os.path.abspath(os.path.dirname(__file__))
-# ディレクトリ以下のテキストファイルを取得
-def getFileList(path):
-    file_list = []
-    for (root, dirs, files) in os.walk(path):
-        for file in files:
-            # パスセパレータは\より/の方が好きなので置換
-            file_list.append( os.path.join(root,file).replace("\", "/") )
-    return file_list
-# DS_Storeを省く
-all_files = getFileList(root_dir)[2:]
-print(all_files)
-all_sentences = []
-for file in all_files:
-	f = open(file, encoding='utf-8')
-	lines = f.readlines()
-	for line in lines:
-		all_sentences.append(line.replace('\n',''))
-```