Rで共起行列を作ることができないものかと思っています。
http://rmecab.jp/wiki/index.php?RMeCabFunctions#v66bb233
上記のサイトを参考にして、
res <- docMatrix("doc", pos = c("名詞","形容詞","助詞"), co = 1)
res
を実行したのですが、以下のような結果が返ってきます。
docs terms Freq
1 file_001.txt 僕 2
2 file_001.txt 本 3
(以下略)
co = 1
を
co = 2
にしても、結果は同じでした。どうも引数coが効いていないようなのです。
MeCabのバージョンが古いのかなとも思いましたが、
上記サイトの記事よりも後にアップされたものみたいなので、
MeCabのバージョンの問題ではなさそうです。
共起行列が結果として得られた方のご連絡をお待ちしております。
なお、
term1 term2 Freq
僕 本 2
という形式の結果でも構いませんので、当該結果を得られる方法をご存知の方もご連絡いただけると幸いです。
以下、独り言みたいなものです。
上記の方法が使えないなら、
collocate()関数を使おうかなと思っているのですが、
この関数は、ある一語に注目した結果を返すような仕様なんですよね。
なので、collocate()関数を用い、語を変えて結果を集計する関数を自作しないといけないのかなとも思っています。
他に、以下のサイトにあるようなNgramDF()関数を用いた方法もあるみたいですが、
http://langstat.hatenablog.com/entry/20140917/1410879600
石田先生の「Rによるテキストマイニング入門」p.72によると、
厳密には、共起ではなくバイグラムなんですよね。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。