回答編集履歴

1

インデントを修正

2017/05/17 16:21

投稿

umyu
umyu

スコア5846

test CHANGED
@@ -1,16 +1,16 @@
1
1
  どこまで現状出来ていて、どこから出来ないのかを明確にしたほうが回答がつきやすいと思います。
2
2
 
3
3
  0. ファイルの読み込み。
4
+
5
+ [open](https://docs.python.jp/3/library/functions.html#open)、[csv](https://docs.python.jp/3/library/csv.html)
6
+
7
+
4
8
 
5
9
  0. Mecabで形態素解析の仕方
6
10
 
7
11
  0. TF-IDFの求め方
8
12
 
9
-
10
-
11
13
  scikit-learnには[TfidfVectorizer](http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html)があります。
12
-
13
-
14
14
 
15
15
  TfidfVectorizerのコンストラクタ引数にはtokenizer のコールバックを渡せます。
16
16