質問編集履歴
12
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,4 +1,6 @@
|
|
1
1
|
![図1 ダイエットの類義語一覧](05566b6d79b3ac8905762262071594c4.png)
|
2
|
+
|
3
|
+
図1 ダイエットの類義語一覧
|
2
4
|
|
3
5
|
|
4
6
|
|
11
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,3 +1,7 @@
|
|
1
|
+
![図1 ダイエットの類義語一覧](05566b6d79b3ac8905762262071594c4.png)
|
2
|
+
|
3
|
+
|
4
|
+
|
1
5
|
### 前提・実現したいこと
|
2
6
|
|
3
7
|
|
@@ -14,7 +18,7 @@
|
|
14
18
|
|
15
19
|
|
16
20
|
|
17
|
-
具体的には,Word2Vecを用いて類似語を抽出した後にその中で最も類似度の高い語を抽出する方法と単語の置換方法が分からないです.
|
21
|
+
具体的には,Word2Vecを用いて類似語を抽出した後にその中で最も類似度の高い語を抽出する方法(図1の"減量"を抽出する方法)と単語の置換方法が分からないです.
|
18
22
|
|
19
23
|
|
20
24
|
|
10
改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
具体的には,Word2Vecを用いて類似語を抽出した後に
|
17
|
+
具体的には,Word2Vecを用いて類似語を抽出した後にその中で最も類似度の高い語を抽出する方法と単語の置換方法が分からないです.
|
18
18
|
|
19
19
|
|
20
20
|
|
9
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語を置換したら良いかが分からないです.
|
17
|
+
具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語を置換したら良いか と 単語の置換方法が分からないです.
|
18
18
|
|
19
19
|
|
20
20
|
|
8
改善
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
ある単語をWord2Vecで最も類似度の高い単語で置換したい
|
test
CHANGED
@@ -2,11 +2,11 @@
|
|
2
2
|
|
3
3
|
|
4
4
|
|
5
|
-
MeCabで文章を分かち書きして,Word2Vecを用いることである単語と最も類似度の高い単語を置換したい
|
5
|
+
MeCabで文章を分かち書きして,Word2Vecを用いることである単語と最も類似度の高い単語を置換したい.
|
6
6
|
|
7
7
|
|
8
8
|
|
9
|
-
置換したい単語を難解語として変数selに入れます.その変数selと,Word2Vecの結果であるresultの中で最も類似度の高い単語を置換したいです
|
9
|
+
置換したい単語を難解語として変数selに入れます.その変数selと,Word2Vecの結果であるresultの中で最も類似度の高い単語を置換したいです.
|
10
10
|
|
11
11
|
|
12
12
|
|
7
改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -6,7 +6,7 @@
|
|
6
6
|
|
7
7
|
|
8
8
|
|
9
|
-
置換したい単語を難解語としてselに入れます.そのselと,resultの中で最も類似度の高い単語を置換したいです
|
9
|
+
置換したい単語を難解語として変数selに入れます.その変数selと,Word2Vecの結果であるresultの中で最も類似度の高い単語を置換したいです
|
10
10
|
|
11
11
|
|
12
12
|
|
6
誤字
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
|
1
|
+
MeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
|
test
CHANGED
File without changes
|
5
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -44,7 +44,7 @@
|
|
44
44
|
|
45
45
|
m = MeCab.Tagger("-Owakati")
|
46
46
|
|
47
|
-
print("分かち書きしたい文章
|
47
|
+
print("分かち書きしたい文章")
|
48
48
|
|
49
49
|
x = input()
|
50
50
|
|
4
改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -44,13 +44,13 @@
|
|
44
44
|
|
45
45
|
m = MeCab.Tagger("-Owakati")
|
46
46
|
|
47
|
-
print("分かち書きしたい文章")
|
47
|
+
print("分かち書きしたい文章を入力してね")
|
48
48
|
|
49
49
|
x = input()
|
50
50
|
|
51
51
|
print("入力文:" ,x)
|
52
52
|
|
53
|
-
r
|
53
|
+
word = m.parse(x).split()
|
54
54
|
|
55
55
|
|
56
56
|
|
@@ -62,7 +62,7 @@
|
|
62
62
|
|
63
63
|
writer = csv.writer(f)
|
64
64
|
|
65
|
-
writer.writerow(r
|
65
|
+
writer.writerow(word)
|
66
66
|
|
67
67
|
|
68
68
|
|
@@ -80,9 +80,9 @@
|
|
80
80
|
|
81
81
|
with open('test.csv') as fileA:
|
82
82
|
|
83
|
-
with open('r
|
83
|
+
with open('word.csv', mode="w") as r: //testとtest2を比べて,
|
84
84
|
|
85
|
-
reader = csv.reader(fileA,delimiter=',')
|
85
|
+
reader = csv.reader(fileA,delimiter=',') //testにしかない単語(難解語)をword.csvに出力
|
86
86
|
|
87
87
|
writer = csv.writer(r)
|
88
88
|
|
@@ -104,6 +104,8 @@
|
|
104
104
|
|
105
105
|
|
106
106
|
|
107
|
+
|
108
|
+
|
107
109
|
```
|
108
110
|
|
109
111
|
|
3
誤字
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
MeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
|
1
|
+
ごじMeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
|
test
CHANGED
@@ -66,7 +66,7 @@
|
|
66
66
|
|
67
67
|
|
68
68
|
|
69
|
-
with open('
|
69
|
+
with open('test2.csv') as fileB:
|
70
70
|
|
71
71
|
reader = csv.reader(fileB,delimiter=',')
|
72
72
|
|
2
修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -13,6 +13,8 @@
|
|
13
13
|
(例)僕はダイエット中だ → 僕は減量中だ
|
14
14
|
|
15
15
|
|
16
|
+
|
17
|
+
具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語を置換したら良いかが分からないです.
|
16
18
|
|
17
19
|
|
18
20
|
|
1
改善
test
CHANGED
File without changes
|
test
CHANGED
@@ -24,13 +24,81 @@
|
|
24
24
|
|
25
25
|
```Python
|
26
26
|
|
27
|
-
pr
|
27
|
+
from gensim.models import word2vec
|
28
28
|
|
29
|
-
|
29
|
+
import csv
|
30
30
|
|
31
|
-
|
31
|
+
import MeCab
|
32
32
|
|
33
|
+
|
34
|
+
|
35
|
+
model = word2vec.Word2Vec.load("./wiki.model")
|
36
|
+
|
37
|
+
|
38
|
+
|
39
|
+
dictB = {}
|
40
|
+
|
41
|
+
|
42
|
+
|
43
|
+
m = MeCab.Tagger("-Owakati")
|
44
|
+
|
45
|
+
print("分かち書きしたい文章")
|
46
|
+
|
47
|
+
x = input()
|
48
|
+
|
49
|
+
print("入力文:" ,x)
|
50
|
+
|
51
|
+
result = m.parse(x).split()
|
52
|
+
|
53
|
+
|
54
|
+
|
55
|
+
print("結果:" ,m.parse(x))
|
56
|
+
|
57
|
+
|
58
|
+
|
59
|
+
with open('test.csv', mode="w") as f:
|
60
|
+
|
61
|
+
writer = csv.writer(f)
|
62
|
+
|
63
|
+
writer.writerow(result)
|
64
|
+
|
65
|
+
|
66
|
+
|
67
|
+
with open('gomantest.csv') as fileB:
|
68
|
+
|
69
|
+
reader = csv.reader(fileB,delimiter=',')
|
70
|
+
|
71
|
+
for row in reader:
|
72
|
+
|
73
|
+
for sel in row:
|
74
|
+
|
75
|
+
dictB[sel] = True
|
76
|
+
|
77
|
+
|
78
|
+
|
79
|
+
with open('test.csv') as fileA:
|
80
|
+
|
81
|
+
with open('result.csv', mode="w") as r:
|
82
|
+
|
83
|
+
reader = csv.reader(fileA,delimiter=',')
|
84
|
+
|
85
|
+
writer = csv.writer(r)
|
86
|
+
|
87
|
+
for row in reader:
|
88
|
+
|
89
|
+
for sel in row:
|
90
|
+
|
91
|
+
if sel not in dictB:
|
92
|
+
|
93
|
+
print("難解語:" ,sel)
|
94
|
+
|
95
|
+
writer.writerow([sel])
|
96
|
+
|
97
|
+
results = model.wv.most_similar(positive=[sel])
|
98
|
+
|
99
|
+
for result in results:
|
100
|
+
|
33
|
-
print(result)
|
101
|
+
print(result)
|
34
102
|
|
35
103
|
|
36
104
|
|