R言語を用いて文章集合に対してTF-IDFを算出する際に
lang
1res = docMatrix("txt", pos=c("名詞", "形容詞"), weight="tf*idf*norm")
と記述するのですが
名詞や形容詞の中でも、非自立語や数を取り除きたいときはどのようにすれば良いのでしょうか?
よろしくお願いいたします。
あなたの回答
tips
プレビュー
投稿2017/01/27 06:02
R言語を用いて文章集合に対してTF-IDFを算出する際に
lang
1res = docMatrix("txt", pos=c("名詞", "形容詞"), weight="tf*idf*norm")
と記述するのですが
名詞や形容詞の中でも、非自立語や数を取り除きたいときはどのようにすれば良いのでしょうか?
よろしくお願いいたします。
あなたの回答
tips
プレビュー