回答編集履歴

抜け

2020/01/19 14:19

投稿

スコア11044

test CHANGED Viewed

@@ -42,7 +42,7 @@
-単語の類似度を求めるための方法として、似た使われ方をしている単語を近似的に探索している、というのは合ってます。
+単語間の類似度を求めるための方法として、似た使われ方をしている単語を近似的に探索している、というのは合ってます。

追記

2020/01/19 14:18

投稿

スコア11044

test CHANGED Viewed

@@ -23,3 +23,31 @@
 word2vecでいう類義語(most similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。
+----
+(追記)
+> 文章内に、似た使われ方をしている単語の類似度を求めるのでしょうか。
+それとも、意味的に似ている単語の類似度を求めているのでしょうか。
+ここは文がちょっとおかしいかと。
+単語の類似度を求めるための方法として、似た使われ方をしている単語を近似的に探索している、というのは合ってます。
+「似た使われ方をしている単語は意味も似ている(大意)」という仮説が1950年代からあって、word2vec以前でも「頻度情報をベクトルだと思ったもの」でそこそこ問題は解けることはわかっていて、そのことからこの仮説は(ある程度は)正しいと考えられていました。
+word2vec の登場で**大規模な文書**から**現実的な時間**で学習できるようになって、ベクトルの質が一気に向上したという感じでしょうか。

些細

2020/01/19 04:01

投稿

スコア11044

test CHANGED Viewed

@@ -22,4 +22,4 @@
-word2vecでいう類義語(moso similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。
+word2vecでいう類義語(most similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。

追記

2020/01/19 02:25

投稿

スコア11044

test CHANGED Viewed

@@ -1,7 +1,25 @@
-書きかけで投稿されてしまいました。追記中です
+> 意味を考慮せず、ただ単語の使われ方の類似度で求めている
+「意味」と「単語の使われ方」の何が違うか説明できますか?
-「意味的に似ている」とはどういう現象かあなたは定義できますか?どういう基準をクリアしたら「意味的に似ている」と
+「意味的に似ている」とはどういう現象か定義できますか?
+どういう基準をクリアしたら「意味的に似ている」ということになりますか?
 定義できるならそれを実装すれば話は終了です。
+が、それはできないわけです。
+大量のテキスト中で、ある単語の周辺に現れる単語の頻度を数えて、頻度を高次元のベクトルだとみなす。あるいはそれを次元削減するのはナイーブなやり方です。
+word2vecはそのようなベクトルを近似的に高速に取得する実装です。
+word2vecでいう類義語(moso similar)は、単純にベクトル間の「距離が小さい」語を指すかと思います。

追記

2020/01/19 00:58

投稿

スコア11044

test CHANGED Viewed

@@ -1,3 +1,7 @@
+書きかけで投稿されてしまいました。追記中です
 「意味的に似ている」とはどういう現象かあなたは定義できますか?どういう基準をクリアしたら「意味的に似ている」と
 定義できるならそれを実装すれば話は終了です。