質問編集履歴
1
一部質問の削除
test
CHANGED
File without changes
|
test
CHANGED
@@ -6,7 +6,7 @@
|
|
6
6
|
|
7
7
|
|
8
8
|
|
9
|
-
#
|
9
|
+
# 疑問
|
10
10
|
|
11
11
|
|
12
12
|
|
@@ -19,29 +19,3 @@
|
|
19
19
|
|
20
20
|
|
21
21
|
`get_feature_names()`の結果は2つが別々になっているのでしょうか?
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
# 2つ目の疑問
|
26
|
-
|
27
|
-
|
28
|
-
|
29
|
-
```python
|
30
|
-
|
31
|
-
vectorizer = TfidfVectorizer(analyzer=self.analyzer)
|
32
|
-
|
33
|
-
vectorizer_output = vectorizer.fit_transform(self._corpus)
|
34
|
-
|
35
|
-
terms = vectorizer.get_feature_names()
|
36
|
-
|
37
|
-
tfidfs = vectorizer_output.toarray()[:len(self._corpus)]
|
38
|
-
|
39
|
-
```
|
40
|
-
|
41
|
-
|
42
|
-
|
43
|
-
上のコードを実行し、変数`tfidfs`と`terms`から、ある文章Aに含まれるtermのtfidfを求めて文章Aの合計tfidfを計算できますが、`fit()`と`transform()`を正しく(?)使えばもっと簡単に計算できますか?
|
44
|
-
|
45
|
-
|
46
|
-
|
47
|
-
できるとしたら、どのようなコードになるのか教えてください。
|