質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.84%

  • MacOS(OSX)

    1741questions

    MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

  • Mecab

    136questions

    Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

mecabのユーザー辞書追加をしても反映されません。

受付中

回答 1

投稿 編集

  • 評価
  • クリップ 2
  • VIEW 181

環境はMac OS High Sierraです。
mecabで辞書を新しく登録するために、下記のようなcsv(utf-8)をつくり、ユーザー辞書として追加しました。

肝機能障害,,,0,名詞,一般,*,*,*,*,*,*,*
➜  userdic /usr/local/libexec/mecab/mecab-dict-index \
-d /usr/local/lib/mecab/dic/ipadic \
-u /usr/local/lib/mecab/dic/userdic/medical.dic \
-f utf-8 -t utf-8 medical_terms.csv
reading medical_terms.csv ... 1
emitting double-array: 100% |###########################################|

done!
➜  userdic ls
medical.dic       medical_terms.csv

➜  userdic echo '肝機能障害' | mecab -u medical.dic -N2
肝      接頭詞,名詞接続,*,*,*,*,肝,カン,カン
機能    名詞,サ変接続,*,*,*,*,機能,キノウ,キノー
障害    名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
EOS
肝      名詞,一般,*,*,*,*,肝,キモ,キモ
機能    名詞,サ変接続,*,*,*,*,機能,キノウ,キノー
障害    名詞,一般,*,*,*,*,障害,ショウガイ,ショーガイ
EOS

上記のようにmecab-dict-indexは問題なく実行できています。IPA品詞体系は問題ないはずです。コストの問題も考え、-N2オプションもつけていますが、やはり今回作成したユーザー辞書が反映されていないようです。

他にどういった原因が考えられますでしょうか?どうぞよろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • quiqui

    2018/04/23 14:48

    /usr/local/lib/mecab/dic/userdic がカレントディレクトリですか?

    キャンセル

  • HidekiNinomiya

    2018/04/25 18:28

    お返事遅れましてすみません。カレンドディレクトリはそうです。

    キャンセル

  • quiqui

    2018/04/27 09:36

    だとしたら、確かに、何も問題がなさそうです。mecab -u medical.dic -D を見て、想定しているファイルを読んでいるかどうか見てみるぐらいでしょうか。(本当に念のため程度で)

    キャンセル

回答 1

+1

手元環境(ubuntuですが。。)で確認したところ、その操作で問題なく辞書が反映されました。
当てずっぽうですが、mecabのインストール時の文字コードがEUC-JPだったのかもしれません。辞書と合わせておく必要があります。
mecab -P | grep config-charset
で確認してみてください。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/22 15:31

    おっしゃる通り、config-charsetはEUC-JPでした。再インストールでUTF-8に変更できたのですが、やはり実行したときの状況は同じで、ユーザー辞書は適用されていませんでした。

    キャンセル

  • 2018/04/22 15:43

    再インストールの手順を教えてください

    キャンセル

  • 2018/04/22 16:07

    ありがとうございます。
    http://graffitinote.hatenadiary.jp/entry/2016/11/15/192209
    上記に従ってアンインストールしまして、
    https://qiita.com/junpooooow/items/0a7d13addc0acad10606
    のような形でnkfを使って無理やりutf-8に変更して再インストールしました。

    キャンセル

  • 2018/04/22 17:11

    その方法でトラブルが起きないのかどうかは判断しかねますが、UTF-8でmecabをインストールできており、正常に動作しているとすると、申し訳ありませんがちょっと私の手には負えないです。。。

    キャンセル

  • 2018/04/22 18:06

    承知しました。ありがとうございます。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.84%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    wikipediaのタイトルを辞書に追加したい

    MeCabの辞書にwikipediaのタイトルの単語を追加する方法を教えてください。 どなたか教えてください。宜しくお願いします。

  • 解決済

    形態素解析の結果の一部だけを取得したい

    windows環境で、PHPでMeCabを使って形態素解析をしています。 その結果の中から、品詞(動詞、名詞など)と原形だけを取得したいのですが、どうすればいいでしょうか?

  • 受付中

    unk.defファイルの場所について

    mecabで記号を使うために、unk.defファイルを変更したいのですが、見つかりません。 通常ある場所や、ファイルを見つけるためのコマンドを教えていただけませんでしょうか? な

  • 解決済

    RでRMeCabC()を試すと文字化けしてしまいます...。

    前提・実現したいこと RMeCabを使って形態素解析をしたいです。 RとRMeCabのインストールには成功し、 ターミナルでは以下のように成功したのですが、 $ ech

  • 受付中

    Pyhtonでnattoが使えない

    毎度お世話になっております。 質問させていだきます。 Pythonで自然言語処理周りを試してみたく、nattoを使ってみようと思いまして、mecabインストールからのpipにて

  • 解決済

    pythonでMecabを利用した語彙解析がうまくできない。

    ●環境 ・Windows Edition:Windows 7 Professional  Service Pack 1 ・pythonバージョン:Python 3.6.2 (v3.

  • 解決済

    mecab 品詞 選択

    やりたいこと 選択したテキストファイル内の文章をmecabを用いて形態素解析し、 品詞(名詞、動詞など)を絞り込みたいと考えています。 現在、テキストファイルの文章を形態素解析する

  • 解決済

    テキストに番号を付けて管理したい

    困っていること 入力したファイルのトピックを抽出するための前段階として 指定したディレクトリ内の.txtファイルを用いてLDAモデルを作成するプログラムを実装したのですが、 現在の

同じタグがついた質問を見る

  • MacOS(OSX)

    1741questions

    MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

  • Mecab

    136questions

    Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。