回答編集履歴
1
追記
answer
CHANGED
@@ -10,4 +10,8 @@
|
|
10
10
|
|
11
11
|
テキストデータ相手でやりたいなら、scikit-learnのCountVectorizerを使っていただくのが比較的簡便です。
|
12
12
|
|
13
|
-
[sklearn.feature_extraction.text.CountVectorizer — scikit-learn 0.21.3 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html)
|
13
|
+
[sklearn.feature_extraction.text.CountVectorizer — scikit-learn 0.21.3 documentation](https://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html)
|
14
|
+
|
15
|
+
また、gensimというテキストからの特徴抽出に特化したライブラリもあります。リファレンスやネットの使用例を見てみて、目的に合っていそうな方を選ぶと良いでしょう。
|
16
|
+
|
17
|
+
[gensim: corpora.dictionary – Construct word<->id mappings](https://radimrehurek.com/gensim/corpora/dictionary.html)
|