最近、自然言語処理の分野を勉強し始めた者です。
文章中の単語をベクトルで表現する手法としてWord2vec、
その拡張手法として文書と単語を同次元のベクトルで表現した手法がDoc2vecであると思いますが
質問1
Word2vecで得られる単語ベクトルとDoc2vecで得られる単語ベクトルは意味が異なるのでしょうか。
例えば、word2vecでは野球ベクトルとソフトボールベクトルの類似度が0.8で、
doc2vecでは類似度が0.85
質問2
複数の文書を1つのカテゴリとみなして、幾つかのカテゴリを作成した場合
Doc2vecで入力層に各文書を入力するのではなくて、
作成したカテゴリを入力する事で各カテゴリのベクトルは作成できるのでしょうか。
正直ニューラルネットワークの理解が不十分なので、
質問の意味も間違ってるかも知れませんが、宜しくお願いします。

バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2018/12/07 07:22