質問編集履歴
1
コードの追加、環境
title
CHANGED
File without changes
|
body
CHANGED
@@ -12,4 +12,20 @@
|
|
12
12
|
|
13
13
|
それでtfを求めるためにCounterのmost_commonを使って全単語の出現回数をカウントすることはできたのですが、この出現回数を全部足しすのどうやるんだってところで詰んでしまいました。。。
|
14
14
|
|
15
|
-
tfとdfを求めるためのアルゴリズム、手順をご教授いただけないでしょうか(汗)
|
15
|
+
tfとdfを求めるためのアルゴリズム、手順をご教授いただけないでしょうか(汗)
|
16
|
+
|
17
|
+
|
18
|
+
<追記>コードはこんな感じです。
|
19
|
+
nounsというリストが上で説明したような名刺を入れている2次元のリストになります。
|
20
|
+
また、jupyter notebookでコードを書いています。
|
21
|
+
|
22
|
+
```
|
23
|
+
from collections import Counter
|
24
|
+
|
25
|
+
def flatten_2dim(array):
|
26
|
+
return [item for sublist in array for item in sublist]
|
27
|
+
|
28
|
+
counter = Counter(flatten_2dim(nouns))
|
29
|
+
for word, cnt in counter.most_common():
|
30
|
+
print(word, cnt)
|
31
|
+
```
|