前提・実現したいこと
Windows 10 の環境の"RStudio"で"RMeCab"を使って形態素解析がしたい。
文字化けする。
発生している問題・エラーメッセージ
RMeCabC("本を読んだ")
[[1]]
險伜捷
"<96>"
[[2]]
蜷崎ゥ<9e>
"{"
[[3]]
險伜捷
"を読んだ"
該当のソースコード
Rのバージョンは3.5.1, x86_64_w64-mingw32/x64 (64bit)
試したこと
Sys.getlocale()
[1] "LC_COLLATE=Japanese_Japan.932;LC_CTYPE=Japanese_Japan.932;LC_MONETARY=Japanese_Japan.932;LC_NUMERIC=C;LC_TIME=Japanese_Japan.932"
Sys.setlocale("LC_CTYPE","CP932")
[1] ""
警告メッセージ:
Sys.setlocale("LC_CTYPE", "CP932") で:
ロケールを "CP932" に設定せよとの OS のレポート要求は受け入れられません
補足情報(FW/ツールのバージョンなど)
[1] コマンドプロンプトでも似たような化け方をします。
Microsoft Windows [Version 10.0.16299.611]
(c) 2017 Microsoft Corporation. All rights reserved.
C:\Users\renkei>mecab
本を読んだ
險伜捷,荳闊ャ,,,,,*
{ 蜷崎ゥ・繧オ螟画磁邯・,,,,*
を読んだ 險伜捷,荳闊ャ,,,,,*
EOS
[2] pythonでは正常に動作しています。
Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:59:51) [MSC v.1914 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.
import MeCab
m=MeCab.parse("本を読んだ")
Traceback (most recent call last):
File "<pyshell#1>", line 1, in <module>
m=MeCab.parse("本を読んだ")
AttributeError: module 'MeCab' has no attribute 'parse'
m=MeCab.Tagger()
print(m.parse("本を読んだ"))
本 名詞,一般,,,,,本,ホン,ホン
を 助詞,格助詞,一般,,,,を,ヲ,ヲ
読ん 動詞,自立,,,五段・マ行,連用タ接続,読む,ヨン,ヨン
だ 助動詞,,,,特殊・タ,基本形,だ,ダ,ダ
EOS
あなたの回答
tips
プレビュー