前提・実現したいこと
1文15wordsほどの文章を1行ずつ並べたテキストファイルがあります。
word2vecでwindowサイズを指定する箇所があると思うのですが、windowサイズを例えば20にした場合、前後の文章まで範囲が溢れてしまうことはあるのでしょうか。
また、window = 20 の時、n行目の最初の単語から前の文章も含めて前後20単語なのか、その文章内で範囲を20分だけとるのかどちらでしょうか。
該当のソースコード
python
1from gensim.models import word2vec 2import os 3 4sentence = word2vec.Text8Corpus('totaltrain.txt') 5model = word2vec.Word2Vec(sentence, size=300, min_count=0, window=10, iter=1000) 6 7model.save('totaltrain.model')
ここにより詳細な情報を記載してください。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/12/09 04:10