前提・実現したいこと
次のユーザー辞書を作成し、pythonのJupyter Notebookで形態素解析を行いたいです。
駐車場, 1285, 1285, 3000, 名詞, 一般, *, *, *, *, 駐車場, チュウシャジョウ, チューシャジョー(Excelで作成し、words.csvとしてUTF-8形式で保存)
その後、コマンドプロンプトを動かし、user.dicを作成。(これは、成功しています)
そして、C:\Program Files (x86)\MeCab\etc\mecabrcを開き、
userdic = C:\Users\yamakazu\user.dic
を追加して、上書きしました。
発生している問題・エラーメッセージ
該当のソースコード部分のコードを実行したところ、
この コノ この 連体詞 駐車 チュウシャ 駐車 名詞-サ変接続 場 ジョウ 場 名詞-接尾-一般 は ハ は 助詞-係助詞 広い ヒロイ 広い 形容詞-自立 形容詞・アウオ段 基本形 な ナ な 助詞-終助詞 。 。 。 記号-句点 EOS
となり、ユーザー辞書が反映されていないままとなります。エラーは発生していません。
該当のソースコード
python
1import MeCab 2import sys 3m = MeCab.Tagger("-Ochasen -u user.dic") 4text = m.parse("この駐車場は広いな。") 5print(text)
試したこと
・コマンドプロンプトで次のことを確認しました。
C:\Users\yamakazu>"C:\Program Files (x86)\MeCab\bin\mecab-dict-index" -d"C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f UTF-8 -t UTF-8 C:\Users\yamakazu\words.csv reading C:\Users\yamakazu\words.csv ... 1 emitting double-array: 100% |#########################################| done! C:\Program Files (x86)\MeCab\bin> mecab -D filename: C:\Program Files (x86)\MeCab\etc..\dic\ipadic\sys.dic version: 102 charset: UTF-8 type: 0 size: 392126 left size: 1316 right size: 1316 filename: C:\Users\yamakazu\user.dic version: 102 charset: UTF-8 type: 1 size: 1 left size: 1316 right size: 1316
となるので、おそらくuser.dicは、ちゃんと更新されているものと思われます。
・mecabを立ち上げて、”駐車場”と入力すると、ユーザー辞書の情報が表示されました。
補足情報(FW/ツールのバージョンなど)
OSは、windows8.1で、環境は、python(Anaconda3)のJupyter Notebookを使用しています。
いろいろ調べたものの、何が原因でうまくpythonに反映できないのか分かりません。よろしくお願いいたします。
参考にしたサイトはこちらになります。
MeCabでオリジナル辞書を作成する
MeCabに自分でカスタマイズした辞書を追加する
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/06 04:53
2019/09/06 05:10
2019/09/06 05:15
2019/09/06 05:56
2019/09/06 06:18