回答率: 85.30%

質問するログイン新規登録

トップ NumPyに関する質問【Python】BoWの作成の高速化

編集履歴

回答編集履歴

1

追記

2019/10/17 10:44

投稿

スコア30939

answer CHANGED Viewed

@@ -10,4 +10,8 @@
 テキストデータ相手でやりたいなら、scikit-learnのCountVectorizerを使っていただくのが比較的簡便です。
-[sklearn.feature_extraction.text.CountVectorizer — scikit-learn 0.21.3 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html)
+[sklearn.feature_extraction.text.CountVectorizer — scikit-learn 0.21.3 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html)
+また、gensimというテキストからの特徴抽出に特化したライブラリもあります。リファレンスやネットの使用例を見てみて、目的に合っていそうな方を選ぶと良いでしょう。
+[gensim: corpora.dictionary – Construct word<->id mappings](https://radimrehurek.com/gensim/corpora/dictionary.html)