teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

1

追記

2019/10/17 10:44

投稿

hayataka2049
hayataka2049

スコア30939

answer CHANGED
@@ -10,4 +10,8 @@
10
10
 
11
11
  テキストデータ相手でやりたいなら、scikit-learnのCountVectorizerを使っていただくのが比較的簡便です。
12
12
 
13
- [sklearn.feature_extraction.text.CountVectorizer — scikit-learn 0.21.3 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html)
13
+ [sklearn.feature_extraction.text.CountVectorizer — scikit-learn 0.21.3 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html)
14
+
15
+ また、gensimというテキストからの特徴抽出に特化したライブラリもあります。リファレンスやネットの使用例を見てみて、目的に合っていそうな方を選ぶと良いでしょう。
16
+
17
+ [gensim: corpora.dictionary – Construct word<->id mappings](https://radimrehurek.com/gensim/corpora/dictionary.html)