回答編集履歴
2
コード例修正
test
CHANGED
@@ -6,7 +6,7 @@
|
|
6
6
|
|
7
7
|
vectorizer = TfidfVectorizer()
|
8
8
|
|
9
|
-
X = vectorizer.fit_transform(['今日
|
9
|
+
X = vectorizer.fit_transform(['今日 から 働く きっと 働く', '明日 から また 天気 が よく なる', 'これから 頑張る'])
|
10
10
|
|
11
11
|
data = X.data
|
12
12
|
|
@@ -14,12 +14,14 @@
|
|
14
14
|
|
15
15
|
#output = [(data[i], features[i]) for i in range(len(data))]
|
16
16
|
|
17
|
-
print(data) # [1.
|
17
|
+
print(data) # [0.38988801 0.29651988 0.77977602 0.38988801 0.32200242 0.42339448
|
18
18
|
|
19
|
-
|
19
|
+
# 0.42339448 0.42339448 0.42339448 0.42339448 0.70710678 0.70710678]
|
20
20
|
|
21
|
-
print(
|
21
|
+
print(features) # ['から', 'きっと', 'これから', 'なる', 'また', 'よく', '今日', '働く', '天気', '明日', '頑張る']
|
22
22
|
|
23
|
+
print(len(data)) # 12
|
24
|
+
|
23
|
-
print(len(features)) #
|
25
|
+
print(len(features)) # 11
|
24
26
|
|
25
27
|
```
|
1
コード修正
test
CHANGED
@@ -16,6 +16,8 @@
|
|
16
16
|
|
17
17
|
print(data) # [1. 1. 1. 1. 1.]
|
18
18
|
|
19
|
+
print(features) # ['から', 'きっと', '今日', '歩く']
|
20
|
+
|
19
21
|
print(len(data)) # 5
|
20
22
|
|
21
23
|
print(len(features)) # 4
|