R上でRMeCabを用いてあるディレクトリ内の文書を形態素解析し、名詞のみ残し、さらにTF-IDFという手法で単語ごとの重み付けをしたく、以下のようなコードを書きました。
library(RMeCab)
res <- docMatrix("DirectoryName", pos = c("名詞"), weight = "tfidfnorm")
write.csv(res, "/home/users/Document/result.csv")
ほとんどの場合は無事実行完了できるのですが、たまに以下のようなエラーが出ます。
*********************************************************************** failed to execute the command
'"R" BATCH --no-save -q --encoding=UTF-8 R_program "log.txt"'
** log:
library(RMeCab)
res <- docMatrix("DirectoryName", pos = c("名詞"), weight = "tfidfnorm")
file = hoge1.txt
file = hoge2.txt
file = hoge3.txt
// 以下、上記同様ディレクトリ内のファイル名
Error in RMeCabMx(filename, pos, posN, minFreq, kigo, dic, mecabrc, etc) :
cannot set length of non-vector
Calls: docMatrix -> lapply -> FUN -> RMeCabMx -> .Call
Execution halted
色々調べてみましたが、エラーの理由が分かりません。
実行環境は以下の通りです。
OS: Ubuntu 14.04.2 LTS
言語: R version 3.2.1
RMeCab: mecab-0.996
拙い文章となってしまいましたが、ご回答をお願い致します。
あなたの回答
tips
プレビュー