質問編集履歴

コード、エラー内容の追加

2018/09/10 02:55

投稿

pippip

スコア30

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -6,4 +6,28 @@
 #知りたいこと
 「長ネギ」や「青ネギ」の類義語を調べ、その中で意味が近いものに大元である「ねぎ」が来るようにしたいです。わかりやすく言うと「漫画」や「小説」は「本」に分類されるように「長ネギ」も「ねぎ」に分類されるといった、大元の類似度が高くなるようにword2vecでしたいです。
-しかし、野菜に関連したモデルの作り方がわかりません。どう作るのでしょうか。
+しかし、野菜に関連したモデルの作り方がわかりません。どう作るのでしょうか。
+追記
+コードは以下の通りです。
+```python
+from gensim.models import word2vec
+model = word2vec.Word2Vec.load("./wiki.model")
+results = model.wv.most_similar(positive=['ねぎ'])
+for result in results:
+    print(result)
+```
+エラーは以下の通りです。
+```
+C:\Users\yuzuk\PycharmProjects\word2vec\venv\lib\site-packages\gensim\utils.py:1209: UserWarning: detected Windows; aliasing chunkize to chunkize_serial
+  warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")
+Traceback (most recent call last):
+  File "C:/Users/yuzuk/PycharmProjects/word2vec/word2vec.py", line 4, in <module>
+    results = model.wv.most_similar(positive=['ねぎ'])
+  File "C:\Users\yuzuk\PycharmProjects\word2vec\venv\lib\site-packages\gensim\models\keyedvectors.py", line 530, in most_similar
+    mean.append(weight * self.word_vec(word, use_norm=True))
+  File "C:\Users\yuzuk\PycharmProjects\word2vec\venv\lib\site-packages\gensim\models\keyedvectors.py", line 451, in word_vec
+    raise KeyError("word '%s' not in vocabulary" % word)
+KeyError: "word 'ねぎ' not in vocabulary"
+```

7 317