前提・実現したいこと
Mecabを利用した形態素解析を行いたいと思っております。
特定のパターンに対して解析を行うと
文字化けが発生することがわかり、困っております。
発生している問題・エラーメッセージ
下記、具体例を参照ください。
例1)猫がニャーニャー鳴いてる。犬がわんわん吠えてる。
上記のように、猫のニャーニャーというところで文字化けが起きています。
例2)ぷうぷうと煙を吹く。煙を吹く。
![
上記の場合は、なぜか「ぷうぷうと煙を吹く。」とした場合は全滅です。
「煙を吹く。」だけでしたら問題なく解析できております。
なんとなく、辞書にない単語であったり、擬音(オノマトペ?)が入ってくるとおかしくなっているような、
という感じはするのですが、これだという原因が特定できておりません。
(わんわんは大丈夫なんですけどね。。。)
試したこと
・UTF-8への統一
下記Qiitaの記事を参考に、実施させていただきました。
Mecabインストールで文字化けた場合の対処法
・再インストールは試しました。
補足情報(FW/ツールのバージョンなど)
・環境:MacBookPro
・Mecabのバージョン: 0.996
・辞書データ mecab-ipadic-2.7.0-20070801
・辞書データの文字コード情報
必要そうなファイルに対するUTF-8への統一は一通り行っております。
下記、nkfコマンドでの辞書データの文字コード確認です。
正直お手上げ状態で、助けていただけるとありがたいです。
その他解決に必要な情報がありましたら、ご指摘いただければと思います。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/05/07 16:53
2019/05/08 04:28