前提・実現したいこと
PDFのテキストについてNaive Bayesモデルの分析をしたいのですが
トレイン/テストの分割の部分で、下記エラーが出てしまっている状況です
発生している問題・エラーメッセージ
エラーメッセージ > msg.dfm.train<-msg.dfm[1:194,] Error in msg.dfm[1:194, ] : Subscript out of bounds > msg.dfm.test<-msg.dfm[194: nrow(msg.dfm), ] Error in msg.dfm[194:nrow(msg.dfm), ] : Subscript out of bounds
ソースコード msg.dfm.train<-msg.dfm[1:194,] msg.dfm.test<-msg.dfm[194: nrow(msg.dfm), ]
試したこと
head(msg.dfm)
Document-feature matrix of: 1 document, 194 features (0.0% sparse) and 7 docvars.
features
docs female . \ above 25 yes in the valentine days
text1 15 273 296 17 26 37 13 38 10 5
[ reached max_nfeat ... 184 more features ]
上記(194 features)をふまえ
[1:194,],[194: nrow(msg.dfm), ]と設定
(→テキストに詳細な記載がなくご教示頂ければ幸いです)
あなたの回答
tips
プレビュー