###前提・実現したいこと
me cabをutf-8でインストールしたのですが、ターミナル上で解析をすると文字化けするのを解消したいです。例えば、以下の通りです
%mecab こんにちは こんにち? ????,????,*,*,*,*,* ? ̾??,??????³,*,*,*,*,* EOS
似たような質問を参考にし以下のコードを試したところ文字化けしなかったため、MeCabがEUC用になっているのが原因だと思われます。
echo '本日は晴天なり' |iconv -f utf8 -t euc-jp |mecab |iconv -f euc-jp -t utf8 本日 名詞,副詞可能,*,*,*,*,本日,ホンジツ,ホンジツ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 晴天 名詞,一般,*,*,*,*,晴天,セイテン,セイテン なり 助動詞,*,*,*,文語・ナリ,基本形,なり,ナリ,ナリ EOS
しかしダウンロード手順でもutf-8を指定し、mecab -P で確認をしてもconfig-charset: UTF-8となっています。config-charsetがUTF-8なのにEUCになっている理由が分からず、困っています。どうすればよいでしょうか…?
###ダウンロード手順
1.公式サイトからmecab-0.996とmecab-ipadic-2.7.0-20070801をダウンロードし解凍
2.ターミナル上で文字コードを指定せず『./configure』『make』『make check』『sudo make install』を実行
3.pythonで使用するため、『pip install mecab-python3』をターミナル上で実行
4.文字コードを指定しなおすため、mecab-0.996とmecab-ipadic-2.7.0-20070801で『sudo make uninstall』を実行
5.以下のコマンドを実行しmecab-0.996を再インストール
% ./configure --with-charset=“utf-8” % make % make check % sudo make install
6.このページの「解決方法」の通りに、mecab-ipadic-2.7.0-20070801を再インストール
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/05/25 14:22