回答編集履歴

5

抜け

2020/01/19 14:19

投稿

quickquip
quickquip

スコア11044

test CHANGED
@@ -42,7 +42,7 @@
42
42
 
43
43
 
44
44
 
45
- 単語の類似度を求めるための方法として、似た使われ方をしている単語を近似的に探索している、というのは合ってます。
45
+ 単語の類似度を求めるための方法として、似た使われ方をしている単語を近似的に探索している、というのは合ってます。
46
46
 
47
47
 
48
48
 

4

追記

2020/01/19 14:18

投稿

quickquip
quickquip

スコア11044

test CHANGED
@@ -23,3 +23,31 @@
23
23
 
24
24
 
25
25
  word2vecでいう類義語(most similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。
26
+
27
+
28
+
29
+ ----
30
+
31
+ (追記)
32
+
33
+
34
+
35
+ > 文章内に、似た使われ方をしている単語の類似度を求めるのでしょうか。
36
+
37
+ それとも、意味的に似ている単語の類似度を求めているのでしょうか。
38
+
39
+
40
+
41
+ ここは文がちょっとおかしいかと。
42
+
43
+
44
+
45
+ 単語の類似度を求めるための方法として、似た使われ方をしている単語を近似的に探索している、というのは合ってます。
46
+
47
+
48
+
49
+ 「似た使われ方をしている単語は意味も似ている(大意)」という仮説が1950年代からあって、word2vec以前でも「頻度情報をベクトルだと思ったもの」でそこそこ問題は解けることはわかっていて、そのことからこの仮説は(ある程度は)正しいと考えられていました。
50
+
51
+
52
+
53
+ word2vec の登場で**大規模な文書**から**現実的な時間**で学習できるようになって、ベクトルの質が一気に向上したという感じでしょうか。

3

些細

2020/01/19 04:01

投稿

quickquip
quickquip

スコア11044

test CHANGED
@@ -22,4 +22,4 @@
22
22
 
23
23
 
24
24
 
25
- word2vecでいう類義語(moso similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。
25
+ word2vecでいう類義語(most similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。

2

追記

2020/01/19 02:25

投稿

quickquip
quickquip

スコア11044

test CHANGED
@@ -1,7 +1,25 @@
1
- 書きかけ投稿されしまました。追記中です
1
+ > 意味を考慮せず、ただ単語の使われ方の類似度求めてい
2
2
 
3
3
 
4
4
 
5
+ 「意味」と「単語の使われ方」の何が違うか説明できますか?
6
+
5
- 「意味的に似ている」とはどういう現象かあなたは定義できますか?どういう基準をクリアしたら「意味的に似ている」と
7
+ 「意味的に似ている」とはどういう現象か定義できますか?
8
+
9
+ どういう基準をクリアしたら「意味的に似ている」ということになりますか?
10
+
11
+
6
12
 
7
13
  定義できるならそれを実装すれば話は終了です。
14
+
15
+ が、それはできないわけです。
16
+
17
+
18
+
19
+ 大量のテキスト中で、ある単語の周辺に現れる単語の頻度を数えて、頻度を高次元のベクトルだとみなす。あるいはそれを次元削減するのはナイーブなやり方です。
20
+
21
+ word2vecはそのようなベクトルを近似的に高速に取得する実装です。
22
+
23
+
24
+
25
+ word2vecでいう類義語(moso similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。

1

追記

2020/01/19 00:58

投稿

quickquip
quickquip

スコア11044

test CHANGED
@@ -1,3 +1,7 @@
1
+ 書きかけで投稿されてしまいました。追記中です
2
+
3
+
4
+
1
5
  「意味的に似ている」とはどういう現象かあなたは定義できますか?どういう基準をクリアしたら「意味的に似ている」と
2
6
 
3
7
  定義できるならそれを実装すれば話は終了です。