プログラムというよりは単語ベクトルについての質問になります。
開発環境はgoogle Colaboratory。
使っているパッケージはgensimです。
前提として、ウィンドウ幅6~文全体(=文全体から近傍5単語を除いたもの)で単語ベクトルを生成したいと考えています。
例を出して説明すると、下の文の「家」(対象単語)の単語ベクトルを赤文字の単語群を使って生成したいと考えています。
この場合に、
1.ウィンドウ幅「文全体」で学習した単語ベクトルとウィンドウ幅5で学習した単語ベクトルをそれぞれ作り、「文全体」で学習した単語ベクトルからウィンドウ幅5で学習した単語ベクトルを引く。
2.ウィンドウ幅6~「文全体」で単語ベクトルを生成する。
の上記二つの方法で生成された単語ベクトルは、違うものになりますか。それとも、同じものができるのでしょうか。
個人的な考えとしては、どちらの方法も結果的には近傍5単語の影響を除いているため、同じものが出来上がるのではないかと思っているのですが、確信が持てないため、詳しい方の意見を聞かせていただけると助かります。
あなたの回答
tips
プレビュー