##現象
windows10でjupyternotebookを利用しています。
1.mecabのipadic配下にuserdicフォルダを作成し、コンパイルしたuserdic.dicを格納
2.mecabrcにuserdicを記載
mecabrc
1; 2; Configuration file of MeCab 3; 4; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $; 5; 6dicdir = $(rcpath)..\dic\ipadic 7 8userdic = C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic 9 10; output-format-type = wakati 11; input-buffer-size = 8192 12 13; node-format = %m\n 14; bos-format = %S\n 15; eos-format = EOS\n
3.jupyternotebookで辞書の反映を試みるも反映されていない
python
1import MeCab 2mecab = MeCab.Tagger(r'-d C:\Users\username\Documents\Tool\MeCab\dic\ipadic -u C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic')
##試したこと
コマンドプロンプトでmecab textを辞書の反映は確認できました。
jupyternotebook上に反映されない原因として何が考えられるでしょうか。
よろしくお願い致します。
comandline
1C:\Users\username>echo "駿台模試と全統模試どっちが難しい?"|mecab -u C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic 2" 蜷崎ゥ・繧オ螟画磁邯・*,*,*,*,* 3駿台模試 名詞,固有名詞,一般,*,*,*,すんだいもし,スンダイモシ,スンダイモシ 4 險伜捷,荳闊ャ,*,*,*,*,* 5ニ全 蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,* 6統模試 險伜捷,荳闊ャ,*,*,*,*,* 7ヌっ 蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,* 8ソが難しい 險伜捷,荳闊ャ,*,*,*,*,* 9H 蜷崎ゥ・蝗コ譛牙錐隧・邨・ケ・*,*,*,* 10" 蜷崎ゥ・繧オ螟画磁邯・*,*,*,*,* 11EOS 12 13C:\Users\username>python 14Python 3.7.3 (default, Mar 27 2019, 17:13:21) [MSC v.1915 64 bit (AMD64)] :: Anaconda, Inc. on win32 15... 16>>> import MeCab 17>>> m = MeCab.Tagger(r"-Ochasen -u C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic") 18>>> line = m.parse('駿台模試と全統模試どっちが難しい?') 19>>> word = line.split('\n') 20>>> word 21['駿台\tスンダイ\t駿台\t名詞-固有名詞-地域-一般\t\t', '模試\tモシ\t模試\t名詞-一般\t\t', 'と\tト\tと\t助詞-並立助詞\t\t', '全\tチョン\t全\t名詞-固有名詞-人名-姓\t\t', '統\tミツル\t統\t名詞-固有名詞-人名-名\t\t', '模試\tモシ\t模試\t名詞-一般\t\t', 'どっち\tドッチ\tどっち\t名詞-代名詞-一般\t\t', 'が\tガ\tが\t助詞-格助詞-一般\t\t', '難しい\tムズカシイ\t難しい\t形容詞-自立\t形容詞・イ段\t基本形', '?\t?\t?\t記号-一般\t\t', 'EOS', '']
システム辞書とユーザー辞書の情報
comandline
1C:\Users\username>mecab -D 2filename: C:\Users\username\Documents\Tool\MeCab\etc..\dic\ipadic\sys.dic 3version: 102 4charset: UTF-8 5type: 0 6size: 392126 7left size: 1316 8right size: 1316 9 10filename: C:\Users\username\Documents\Tool\MeCab\dic\userdic\userdic.dic 11version: 102 12charset: UTF-8 13type: 1 14size: 6 15left size: 1316 16right size: 1316 17コード
回答1件
あなたの回答
tips
プレビュー