teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

1

コードの追加、環境

2017/11/07 07:16

投稿

退会済みユーザー
title CHANGED
File without changes
body CHANGED
@@ -12,4 +12,20 @@
12
12
 
13
13
  それでtfを求めるためにCounterのmost_commonを使って全単語の出現回数をカウントすることはできたのですが、この出現回数を全部足しすのどうやるんだってところで詰んでしまいました。。。
14
14
 
15
- tfとdfを求めるためのアルゴリズム、手順をご教授いただけないでしょうか(汗)
15
+ tfとdfを求めるためのアルゴリズム、手順をご教授いただけないでしょうか(汗)
16
+
17
+
18
+ <追記>コードはこんな感じです。
19
+ nounsというリストが上で説明したような名刺を入れている2次元のリストになります。
20
+ また、jupyter notebookでコードを書いています。
21
+
22
+ ```
23
+ from collections import Counter
24
+
25
+ def flatten_2dim(array):
26
+ return [item for sublist in array for item in sublist]
27
+
28
+ counter = Counter(flatten_2dim(nouns))
29
+ for word, cnt in counter.most_common():
30
+ print(word, cnt)
31
+ ```