前提・実現したいこと
janomeを使用して形態解析を行っていますが、ユーザ辞書で登録した単語が反映されません。
動詞や形容詞を登録したいのですが、該当単語の前に名詞や助詞が挟まると拾えなくなります。
発生している問題・エラーメッセージ
導線 名詞,一般,*,*,*,*,導線,ドウセン,ドーセン が 助詞,格助詞,一般,*,*,*,が,ガ,ガ 良く 形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,良い,ヨク,ヨク ない 助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ
該当のソースコード
・testdic.csv
良くない,-1,-1,1,動詞,自立,*,*,*,基本形,よくない,ヨクナイ,ヨクナイ
・python_janome.py
from janome.tokenizer import Tokenizer tokenizer = Tokenizer("testdic.csv", udic_enc="utf8") text = '導線が良くない' tokens = tokenizer.tokenize(text) for token in tokens: print(token)
試したこと
前後に何も含めず、登録した単語のみでjanomeにかけると、正常に拾えます。
from janome.tokenizer import Tokenizer tokenizer = Tokenizer("testdic.csv", udic_enc="utf8") text = '良くない' tokens = tokenizer.tokenize(text) for token in tokens: print(token) # 良くない 動詞,自立,*,*,*,基本形,よくない,ヨクナイ,ヨクナイ
あなたの回答
tips
プレビュー