回答率: 85.29%

質問するログイン新規登録

トップ機械学習に関する質問 tfidfのこーどで素数名と計算結果の関係

編集履歴

回答編集履歴

2

コード例修正

2019/04/15 12:57

投稿

スコア38350

answer CHANGED Viewed

@@ -2,12 +2,13 @@
 ```Python
 from sklearn.feature_extraction.text import TfidfVectorizer
 vectorizer = TfidfVectorizer()
-X = vectorizer.fit_transform(['今日','から','働く','きっと','働く'])
+X = vectorizer.fit_transform(['今日 から 働く きっと 働く', '明日 から また 天気 が よく なる', 'これから 頑張る'])
 data = X.data
 features = vectorizer.get_feature_names()
 #output = [(data[i], features[i]) for i in range(len(data))]
-print(data)          # [1. 1. 1. 1. 1.]
+print(data)          # [0.38988801 0.29651988 0.77977602 0.38988801 0.32200242 0.42339448
+                     #  0.42339448 0.42339448 0.42339448 0.42339448 0.70710678 0.70710678]
-print(features)      # ['から', 'きっと', '今日', '歩く']
+print(features)      # ['から', 'きっと', 'これから', 'なる', 'また', 'よく', '今日', '働く', '天気', '明日', '頑張る']
-print(len(data))     # 5
+print(len(data))     # 12
-print(len(features)) # 4
+print(len(features)) # 11
 ```

1

コード修正

2019/04/15 12:57

投稿

スコア38350

answer CHANGED Viewed

@@ -7,6 +7,7 @@
 features = vectorizer.get_feature_names()
 #output = [(data[i], features[i]) for i in range(len(data))]
 print(data)          # [1. 1. 1. 1. 1.]
+print(features)      # ['から', 'きっと', '今日', '歩く']
 print(len(data))     # 5
 print(len(features)) # 4
 ```