pythonで論文を読み込みtf-idf値を求めたいと思います。
そこでtfidfvectorizerというものを使っているのですが、その時、文章を論文を繋げて一つの文章にして実行すると文字数が多すぎて対処できません…
メモリの問題なのかわかりませんが解決できたら嬉しいです。
どなたかtfidfvectorizerに詳しい方に解決法などをお聞きしたいです…
よろしくお願いします!
もう少し具体的にどのような問題を抱えているのかかいてください。エラーがでるのか?エラーが出ているのであればどのようなメッセージがでるのか?実際に実行しているコードとその結果、等々があると分かりやすくなります。
あなたの回答
tips
プレビュー