質問編集履歴

12

修正

2018/11/22 04:20

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -1,4 +1,6 @@
1
1
  ![図1 ダイエットの類義語一覧](05566b6d79b3ac8905762262071594c4.png)
2
+
3
+ 図1 ダイエットの類義語一覧
2
4
 
3
5
 
4
6
 

11

修正

2018/11/22 04:20

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -1,3 +1,7 @@
1
+ ![図1 ダイエットの類義語一覧](05566b6d79b3ac8905762262071594c4.png)
2
+
3
+
4
+
1
5
  ### 前提・実現したいこと
2
6
 
3
7
 
@@ -14,7 +18,7 @@
14
18
 
15
19
 
16
20
 
17
- 具体的には,Word2Vecを用いて類似語を抽出した後にその中で最も類似度の高い語を抽出する方法と単語の置換方法が分からないです.
21
+ 具体的には,Word2Vecを用いて類似語を抽出した後にその中で最も類似度の高い語を抽出する方法(図1の"減量"を抽出する方法)と単語の置換方法が分からないです.
18
22
 
19
23
 
20
24
 

10

改善

2018/11/22 04:18

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -14,7 +14,7 @@
14
14
 
15
15
 
16
16
 
17
- 具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語置換したら良いか  単語の置換方法が分からないです.
17
+ 具体的には,Word2Vecを用いて類似語を抽出した後にその中で最も類似度の高い語を抽出する方法と単語の置換方法が分からないです.
18
18
 
19
19
 
20
20
 

9

修正

2018/11/20 05:59

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -14,7 +14,7 @@
14
14
 
15
15
 
16
16
 
17
- 具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語を置換したら良いかが分からないです.
17
+ 具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語を置換したら良いか と 単語の置換方法が分からないです.
18
18
 
19
19
 
20
20
 

8

改善

2018/11/20 05:58

投稿

退会済みユーザー
test CHANGED
@@ -1 +1 @@
1
- MeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
1
+ ある単語をWord2Vecで最も類似度の高い単語で置換したい
test CHANGED
@@ -2,11 +2,11 @@
2
2
 
3
3
 
4
4
 
5
- MeCabで文章を分かち書きして,Word2Vecを用いることである単語と最も類似度の高い単語を置換したい
5
+ MeCabで文章を分かち書きして,Word2Vecを用いることである単語と最も類似度の高い単語を置換したい
6
6
 
7
7
 
8
8
 
9
- 置換したい単語を難解語として変数selに入れます.その変数selと,Word2Vecの結果であるresultの中で最も類似度の高い単語を置換したいです
9
+ 置換したい単語を難解語として変数selに入れます.その変数selと,Word2Vecの結果であるresultの中で最も類似度の高い単語を置換したいです
10
10
 
11
11
 
12
12
 

7

改善

2018/11/20 05:57

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -6,7 +6,7 @@
6
6
 
7
7
 
8
8
 
9
- 置換したい単語を難解語としてselに入れます.そのselと,resultの中で最も類似度の高い単語を置換したいです
9
+ 置換したい単語を難解語として変数selに入れます.その変数selと,Word2Vecの結果であるresultの中で最も類似度の高い単語を置換したいです
10
10
 
11
11
 
12
12
 

6

誤字

2018/11/20 05:47

投稿

退会済みユーザー
test CHANGED
@@ -1 +1 @@
1
- ごじMeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
1
+ MeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
test CHANGED
File without changes

5

修正

2018/11/20 05:46

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -44,7 +44,7 @@
44
44
 
45
45
  m = MeCab.Tagger("-Owakati")
46
46
 
47
- print("分かち書きしたい文章を入力してね")
47
+ print("分かち書きしたい文章")
48
48
 
49
49
  x = input()
50
50
 

4

改善

2018/11/20 05:45

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -44,13 +44,13 @@
44
44
 
45
45
  m = MeCab.Tagger("-Owakati")
46
46
 
47
- print("分かち書きしたい文章")
47
+ print("分かち書きしたい文章を入力してね")
48
48
 
49
49
  x = input()
50
50
 
51
51
  print("入力文:" ,x)
52
52
 
53
- result = m.parse(x).split()
53
+ word = m.parse(x).split()
54
54
 
55
55
 
56
56
 
@@ -62,7 +62,7 @@
62
62
 
63
63
  writer = csv.writer(f)
64
64
 
65
- writer.writerow(result)
65
+ writer.writerow(word)
66
66
 
67
67
 
68
68
 
@@ -80,9 +80,9 @@
80
80
 
81
81
  with open('test.csv') as fileA:
82
82
 
83
- with open('result.csv', mode="w") as r:
83
+ with open('word.csv', mode="w") as r: //testとtest2を比べて,
84
84
 
85
- reader = csv.reader(fileA,delimiter=',')
85
+ reader = csv.reader(fileA,delimiter=',') //testにしかない単語(難解語)をword.csvに出力
86
86
 
87
87
  writer = csv.writer(r)
88
88
 
@@ -104,6 +104,8 @@
104
104
 
105
105
 
106
106
 
107
+
108
+
107
109
  ```
108
110
 
109
111
 

3

誤字

2018/11/20 05:43

投稿

退会済みユーザー
test CHANGED
@@ -1 +1 @@
1
- MeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
1
+ ごじMeCabで文章を分かち書きして,ある単語をWord2Vecで最も類似度の高い単語で置換したい
test CHANGED
@@ -66,7 +66,7 @@
66
66
 
67
67
 
68
68
 
69
- with open('gomantest.csv') as fileB:
69
+ with open('test2.csv') as fileB:
70
70
 
71
71
  reader = csv.reader(fileB,delimiter=',')
72
72
 

2

修正

2018/11/20 05:24

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -13,6 +13,8 @@
13
13
  (例)僕はダイエット中だ → 僕は減量中だ
14
14
 
15
15
 
16
+
17
+ 具体的には,Word2Vecを用いて類似語を抽出した後にどうやってその中で最も類似度の高い語と入力文中の単語を置換したら良いかが分からないです.
16
18
 
17
19
 
18
20
 

1

改善

2018/11/20 05:23

投稿

退会済みユーザー
test CHANGED
File without changes
test CHANGED
@@ -24,13 +24,81 @@
24
24
 
25
25
  ```Python
26
26
 
27
- print("難解語:" ,sel)
27
+ from gensim.models import word2vec
28
28
 
29
- results = model.wv.most_similar(positive=[sel])
29
+ import csv
30
30
 
31
- for result in results:
31
+ import MeCab
32
32
 
33
+
34
+
35
+ model = word2vec.Word2Vec.load("./wiki.model")
36
+
37
+
38
+
39
+ dictB = {}
40
+
41
+
42
+
43
+ m = MeCab.Tagger("-Owakati")
44
+
45
+ print("分かち書きしたい文章")
46
+
47
+ x = input()
48
+
49
+ print("入力文:" ,x)
50
+
51
+ result = m.parse(x).split()
52
+
53
+
54
+
55
+ print("結果:" ,m.parse(x))
56
+
57
+
58
+
59
+ with open('test.csv', mode="w") as f:
60
+
61
+ writer = csv.writer(f)
62
+
63
+ writer.writerow(result)
64
+
65
+
66
+
67
+ with open('gomantest.csv') as fileB:
68
+
69
+ reader = csv.reader(fileB,delimiter=',')
70
+
71
+ for row in reader:
72
+
73
+ for sel in row:
74
+
75
+ dictB[sel] = True
76
+
77
+
78
+
79
+ with open('test.csv') as fileA:
80
+
81
+ with open('result.csv', mode="w") as r:
82
+
83
+ reader = csv.reader(fileA,delimiter=',')
84
+
85
+ writer = csv.writer(r)
86
+
87
+ for row in reader:
88
+
89
+ for sel in row:
90
+
91
+ if sel not in dictB:
92
+
93
+ print("難解語:" ,sel)
94
+
95
+ writer.writerow([sel])
96
+
97
+ results = model.wv.most_similar(positive=[sel])
98
+
99
+ for result in results:
100
+
33
- print(result)
101
+ print(result)
34
102
 
35
103
 
36
104