こちらを参考にpythonでword2vecを用いて読み込んだ文字列に対して類似性のある単語をしゅつりょくするプログラムを書きました。
しかし以下のようなエラーが出ます
多分そのような語彙が見つかっていないというエラーだと思いますが教師データに用いているファイルには確かに存在するのです。
参考にしたサイトでもちゃんと出力できているのに私の環境ではできないということはあるのでしょうか?
使った教師データは参考サイトで紹介してあったもののうち芥川龍之介の羅生門です
Error
1Traceback (most recent call last): 2 File "test_w2v.py", line 7, in <module> 3 output = model.most_similar(positive = [u'人間']); 4 File "/usr/local/lib/python2.7/site-packages/gensim-0.13.1-py2.7-macosx-10.11-x86_64.egg/gensim/models/word2vec.py", line 1233, in most_similar 5 raise KeyError("word '%s' not in vocabulary" % word) 6KeyError: u"word '\u4eba\u9593' not in vocabulary"
プログラムも添付します。
python
1# -*- coding:utf-8 -*- 2 3from gensim.models import word2vec 4data = word2vec.Text8Corpus('data.txt'); 5model = word2vec.Word2Vec(data, size = 200); 6 7output = model.most_similar(positive = [u'人']); 8for x in output: 9 print x[0] 10 print x[1]
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/12/21 03:26