🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

Q&A

1回答

8039閲覧

RSTUDIOを用いた統計で、日本語の文字化けが治らないため解決法を探しています

KKN12

総合スコア0

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

0グッド

0クリップ

投稿2020/12/09 09:52

前提・実現したいこと

 はじめまして、Rの初心者です。私は大学の授業でRSTUDIO内で、RMecabを用いた文章の統計分析を行うのですが、何度やっても日本語のテキストが文字化けしてしまい困っています。
具体的には.txtファイルをRMeCabFreq関数で統計した時に、右上のENVIRONMENTのコンソールを見ると文字化けが起こる現象です。ファイル自体をRSTUDIOで開いてみる分には大丈夫なのですが、RMecabFreq関数を用いるとなぜか文字化けがおっこてしまうようです。
環境としてはwindowsの64bitで、ファイルはメモの.txtを用いています。解決方法がお分かりになられる方がいらっしゃいましたらご教授願います。

試したこと

TOOLから、GLOBAL OPTIONSとPROJECT OPTIONSの両方でエンコードの設定をUTF-8に変更した。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

KojiDoi

2020/12/09 11:45

その「日本語のテキスト」はutf-8になってますか?
KKN12

2020/12/09 13:41

返信ありがとうございます はい、UTF-8で保存しています 試しにSHIFT-JISでもやってみましたが、できませんでした。
guest

回答1

0

Windows版のMeCabをインストールするとき辞書の文字コードの選択SHIFT-JISを選択されましたでしょうか。
イメージ説明

あとはテキストファイル(Shift-JIS)を用意して、

【shift-jis.txt】
すもももももももものうち

RStudioで実行するだけです。

RStudio

1> library(RMeCab) 2> RMC <- RMeCabText('shift-jis.txt') 3> RMC2 <- unlist(RMC) 4 5> print(RMC2) 6 [1] "すもも" "名詞" "一般" "*" "*" 7 [6] "*" "*" "すもも" "スモモ" "スモモ" 8[11] "も" "助詞" "係助詞" "*" "*" 9[16] "*" "*" "も" "モ" "モ" 10[21] "もも" "名詞" "一般" "*" "*" 11[26] "*" "*" "もも" "モモ" "モモ" 12[31] "も" "助詞" "係助詞" "*" "*" 13[36] "*" "*" "も" "モ" "モ" 14[41] "もも" "名詞" "一般" "*" "*" 15[46] "*" "*" "もも" "モモ" "モモ" 16[51] "のう" "助詞" "終助詞" "*" "*" 17[56] "*" "*" "のう" "ノウ" "ノー" 18>

投稿2020/12/09 14:03

technocore

総合スコア7337

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問