tfの行列をnumpy配列に変換し、0ならFalse、それ以外ならTrueのboolean配列を作って、aixs=0で足せばdfになります(True==1なので)。
python
1>>> import numpy as np
2>>> a = np.array([[0,5,1,0,0,4],[1,0,0,0,2,3],[4,1,0,1,0,0]])
3>>> a
4array([[0, 5, 1, 0, 0, 4],
5 [1, 0, 0, 0, 2, 3],
6 [4, 1, 0, 1, 0, 0]])
7>>> a != 0
8array([[False, True, True, False, False, True],
9 [ True, False, False, False, True, True],
10 [ True, True, False, True, False, False]])
11>>> (a != 0).sum(axis=0)
12array([2, 2, 1, 1, 1, 2])
実用的に使いたいのならsklearnやgensimでモデルが用意されているので、そちらを用いた方が何かと良いです。
sklearn.feature_extraction.text.TfidfVectorizer — scikit-learn 0.20.1 documentation
gensim: models.tfidfmodel – TF-IDF model
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。