回答率: 85.30%

質問するログイン新規登録

トップに関する質問 python janomeの簡略辞書使用時のエラーについて

編集履歴

質問編集履歴

2

写真追加

2018/06/18 03:03

投稿

スコア148

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -15,9 +15,11 @@
 以下が作成した簡略辞書です「100.csv」
 ![簡略辞書](b0b918153bdf1619b6eaff59fffe4dbd.png)
+![イメージ説明](7356a1248c76412881530b094e40efad.png)
 この辞書を読み込ませると
 ```
 #作成した辞書使う場合
 ---------------------------------------------------------------------------
 ValueError                                Traceback (most recent call last)

1

エラー内容追記

2018/06/18 03:03

投稿

スコア148

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -19,9 +19,36 @@
 ```
 #作成した辞書使う場合
+---------------------------------------------------------------------------
+ValueError                                Traceback (most recent call last)
+<ipython-input-13-13ce50d97c07> in <module>()
+     53 #t = Tokenizer()
+     54 #作成した辞書使う場合
-t = Tokenizer(r'C:\Users\Desktop\100.csv', udic_type='simpledic', udic_enc="utf8")
+---> 55 t = Tokenizer(r'C:\Users\Desktop\100.csv', udic_type='simpledic', udic_enc="utf8")
+     56
+     57 ret = []
+~\AppData\Local\Continuum\anaconda3\lib\site-packages\janome\tokenizer.py in __init__(self, udic, udic_enc, udic_type, max_unknown_length, wakati, mmap)
+    166             if udic.endswith('.csv'):
+    167                 # build user dictionary from CSV
+--> 168                 self.user_dic = UserDictionary(udic, udic_enc, udic_type, connections)
+    169             elif os.path.isdir(udic):
+    170                 # load compiled user dictionary
+~\AppData\Local\Continuum\anaconda3\lib\site-packages\janome\dic.py in __init__(self, user_dict, enc, type, connections)
+    372         """
+    373         build_method = getattr(self, 'build' + type)
+--> 374         compiledFST, entries = build_method(user_dict, enc)
+    375         Dictionary.__init__(self, [compiledFST], entries, connections)
+    376
+~\AppData\Local\Continuum\anaconda3\lib\site-packages\janome\dic.py in buildsimpledic(self, user_dict, enc)
+    402             for line in f:
+    403                 line = line.rstrip()
+--> 404                 surface, pos_major, reading = line.split(',')
+    405                 part_of_speech = ','.join([pos_major, u'*', u'*', u'*'])
+    406                 morph_id = len(surfaces)
 ValueError: not enough values to unpack (expected 3, got 1)
 ```
 というエラーが発生しどこが原因か分からず悩んでいます