編集履歴

回答編集履歴

おまけ

2018/06/19 03:41

投稿

スコア1192

answer CHANGED Viewed

@@ -29,4 +29,39 @@
 library(wordcloud)
 wordcloud(results.3, min.freq = 1, colors = brewer.pal(8, "Dark2"))
+```
+####追記
+エラーの原因はよくわかりませんが、扱うファイルが大きくなると問題が起きる傾向があるようなので RMeCab は使用せずに system() から シェルの mecab を使用して処理させる方法を試してみました。
+中間ファイル word_POS.txt を生成してしまいますが、こちらの方法だとエラーは全く起きませんでした。60万語でも大丈夫でした。
+```R
+library(stringr)
+library(wordcloud)
+system('mecab -b 32768 -F"%m_%f[0]\n" -E "" extrabig.txt > word_POS.txt')
+word.vector <- scan("word_POS.txt", what = character(), sep = "\n")
+# あとは全く同じ
+search.word <- "^国民_名詞$" # 検索語を「単語_品詞」という形式で指定
+span <- 5 # スパンの指定（ここでは、左右5語まで）
+span <- (-span : span)
+positions.of.matches <- grep(search.word, word.vector, perl = TRUE)
+results <- NULL
+for(i in 1 : length(span)) {
+collocate.positions <- positions.of.matches + span[i]
+collocates <- word.vector[collocate.positions]
+results <- append(results, collocates)
+}
+results <- str_replace_all(string = results, pattern = search.word, replacement = "")
+not.blank <- which(results != "")
+results <- results[not.blank]
+positions.of.matches.2 <- grep("_名詞", results, perl = TRUE) # ここでは名詞
+results.2 <- results[positions.of.matches.2]
+results.3 <- str_replace_all(string = results.2, pattern = "_名詞", replacement = "") # 品詞の情報（ここでは、"_名詞"の部分）を削除
+wordcloud(results.3, min.freq = 1, colors = brewer.pal(8, "Dark2"))
 ```