python、プログラミング初心者で勉強中のものです。
以下のコードを見かけたのですが、どのような処理をしているのか全くわかりません。
順を追ってどのような処理をしているのか教えてもらうことはできますでしょうか?
python
1n_comp = 20 2 3for i in ['channelTitle','description2','title2']:#,'new_title','new_description', 4 print (i) 5 tfidf_vec = TfidfVectorizer(analyzer='word',ngram_range=(1,2)) 6 text_tfidf = tfidf_vec.fit_transform(df[i].values.tolist() ) 7 text_svd = TruncatedSVD(n_components=n_comp, algorithm='arpack',random_state=9999) 8 df_svd = pd.DataFrame(text_svd.fit_transform(text_tfidf)) 9 df_svd.columns = ['svd_'+str(i)+str(j+1) for j in range(n_comp)] 10 df2 = pd.concat([df,df_svd],axis=1) 11 12for i in ['tags',]: 13 print (i) 14 tfidf_vec = TfidfVectorizer(analyzer='word',ngram_range=(1,1)) 15 text_tfidf = tfidf_vec.fit_transform(df[i].values.tolist() ) 16 text_svd = TruncatedSVD(n_components=n_comp, algorithm='arpack',random_state=9999) 17 df_svd = pd.DataFrame(text_svd.fit_transform(text_tfidf)) 18 df_svd.columns = ['svd_char_'+str(i)+str(j+1) for j in range(n_comp)] 19 df2 = pd.concat([df,df_svd],axis=1)
あなたの回答
tips
プレビュー