質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Model

MVCモデルの一部であるModelはアプリケーションで扱うデータとその動作を管理するために扱います。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

1879閲覧

word2vecのmodelに新規単語を登録する

kongkoukaido

総合スコア1

Model

MVCモデルの一部であるModelはアプリケーションで扱うデータとその動作を管理するために扱います。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Mecab

Mecabは、オープンソースの形態素解析エンジンです。 言語、辞書、コーパスに依存しない汎用的な設計を基本方針としています。 Mecabの由来は、開発者の好物である和布蕪(めかぶ)から名づけられました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/08/02 14:47

word2vecのモデルにコーパスされたテキストファイル"corpas_omosiro.txt"を新規登録しようとしているのですが、以下のエラー文が出てしまい実装できません。
現環境はpython 3.7.4、gensim 3.8.3、mecab(mecab-ipadic-neologdインストール済み)です。

python

1# coding: utf-8 2from gensim.models import word2vec 3import logging 4import sys 5import numpy as np 6import MeCab 7import sys 8import re 9import gensim 10import pprint 11from collections import Counter 12 13logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO) 14 15class W2v(): 16 MODEL = None 17 18 def __init__(self): 19 if W2v.MODEL is None: 20 #学習モデル読み込み 21 W2v.MODEL = gensim.models.KeyedVectors.load_word2vec_format('model.vec', binary=False) 22 23 def similarity(self, word1, word2): 24 print("近似度計算: "+word1+" - "+word2) 25 26 try: 27 return W2v.MODEL.wv.similarity(word1, word2) 28 except KeyError as e: 29 print(e) 30 return -1.0 31 32 def getVec(self, word): 33 try: 34 return W2v.MODEL.wv[word] 35 36 except KeyError: 37 return np.zeros(200) 38 39 #再学習、上書きを行うメソッド 40 def updateTrain(self, corpus): 41 sentences = word2vec.Text8Corpus(corpus) 42 W2v.MODEL.build_vocab(sentences, update=True) 43 W2v.MODEL.train(sentences, total_examples=W2v.MODEL.corpus_count, epochs=W2v.MODEL.iter) 44 W2v.MODEL.save("model.vec") 45 46if __name__ == "__main__": 47 w2v = W2v() 48 49 word = "面白" 50 51 w2v.updateTrain("corpus_omosiro.txt") 52 53 print(word + "=") 54 print(w2v.getVec(word)) 55 56 #単語数の確認 57 print(len(W2v.MODEL.wv.vocab)) 58

エラー文
Traceback (most recent call last):
File "add.py", line 51, in <module>
w2v.updateTrain("corpus_omosiro.txt")
File "add.py", line 42, in updateTrain
W2v.MODEL.build_vocab(sentences, update=True)
AttributeError: 'Word2VecKeyedVectors' object has no attribute 'build_vocab'

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2020/08/02 15:52 編集

質問が書いてありません。 あと、エラーは書いてあるとおり「Word2VecKeyedVectorsにはbuild_vocabメソッドがない」です。ないメソッドを呼ぼうと思ったのはなぜか(=build_vocabメソッドがあるだろうと思ったのはなぜか)も書くとよいかと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問