質問編集履歴
3
写真の追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -2,16 +2,13 @@
|
|
2
2
|
(Tf-idfVectorizerを使わないものとします)
|
3
3
|
|
4
4
|
Tf-idfを表示するにあたり,辞書型で各単語のtf, df, idfを表示させるようにしました.
|
5
|
-
最終的にtfとidfの積を算出する為に,辞書入りのリストに格納したtf値を出そうとした際,以下の
|
5
|
+
最終的にtfとidfの積を算出する為に,辞書入りのリストに格納した単語毎のtf値を出そうとした際,以下の写真のようになりました.
|
6
6
|
|
7
7
|
この件に関しまして,解決策がご存知の方に是非ご教示頂きたいです.
|
8
8
|
宜しくお願いします.
|
9
9
|
|
10
|
-
追記: 写真1,写真2と書かれた箇所は,次のような出力結果が得られています.(写真2は一部を載せています)
|
11
|
-
### 写真
|
10
|
+
### 写真
|
12
|
-

|
13
|
-
### 写真2
|
14
|
-

|
15
12
|
### テキスト
|
16
13
|
```protein.txt
|
17
14
|
全ゲノム配列決定が容易になった結果,多くの新規遺伝子(タンパク質)の存在や機能を配列情報から予測することはかなり容易になった.
|
@@ -116,17 +113,10 @@
|
|
116
113
|
# 単語毎のidf値
|
117
114
|
idfs = {k:np.log(1/v) + 1 for k, v in dfs.items()}
|
118
115
|
|
119
|
-
for num in tfs
|
116
|
+
tf_val = [num.get(doc[0]) for num in tfs] #単語毎にtf値を取り出したい(問題の箇所)
|
120
|
-
print(type(num))
|
121
|
-
print(num)
|
122
117
|
|
123
|
-
for num in doc:#写真2
|
124
|
-
print(type(num))
|
125
|
-
print(num)
|
126
|
-
#tf_val = [num.get(doc) for num in tfs] #単語毎にtf値を取り出したい(問題の箇所)
|
127
|
-
|
128
|
-
|
118
|
+
print('nouns:',nouns)
|
129
|
-
|
119
|
+
print('tf:',tf_val)
|
130
120
|
#print('dfs:',dfs)
|
131
121
|
#print('idfs:',idfs)
|
132
122
|
```
|
2
写真の追加
title
CHANGED
File without changes
|
body
CHANGED
@@ -7,6 +7,11 @@
|
|
7
7
|
この件に関しまして,解決策がご存知の方に是非ご教示頂きたいです.
|
8
8
|
宜しくお願いします.
|
9
9
|
|
10
|
+
追記: 写真1,写真2と書かれた箇所は,次のような出力結果が得られています.(写真2は一部を載せています)
|
11
|
+
### 写真1
|
12
|
+
]
|
13
|
+
### 写真2
|
14
|
+

|
10
15
|
### テキスト
|
11
16
|
```protein.txt
|
12
17
|
全ゲノム配列決定が容易になった結果,多くの新規遺伝子(タンパク質)の存在や機能を配列情報から予測することはかなり容易になった.
|
@@ -111,9 +116,15 @@
|
|
111
116
|
# 単語毎のidf値
|
112
117
|
idfs = {k:np.log(1/v) + 1 for k, v in dfs.items()}
|
113
118
|
|
114
|
-
|
119
|
+
for num in tfs:#写真1
|
120
|
+
print(type(num))
|
115
|
-
print(
|
121
|
+
print(num)
|
116
122
|
|
123
|
+
for num in doc:#写真2
|
124
|
+
print(type(num))
|
125
|
+
print(num)
|
126
|
+
#tf_val = [num.get(doc) for num in tfs] #単語毎にtf値を取り出したい(問題の箇所)
|
127
|
+
|
117
128
|
#print('nouns:',nouns)
|
118
129
|
#print('tfs:',tfs)
|
119
130
|
#print('dfs:',dfs)
|
1
コードの修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -111,7 +111,7 @@
|
|
111
111
|
# 単語毎のidf値
|
112
112
|
idfs = {k:np.log(1/v) + 1 for k, v in dfs.items()}
|
113
113
|
|
114
|
-
tf_val = [num.get(
|
114
|
+
tf_val = [num.get(doc) for num in tfs] #単語毎にtf値を取り出したい(問題の箇所)
|
115
115
|
print(tf_val)
|
116
116
|
|
117
117
|
#print('nouns:',nouns)
|