前提・実現したいこと
word2vec学習済みモデルをtensorboardで可視化しようとしています。
モデルのファイルの名前はtwocities.modelです。
以下のコードでrunsというファイルを作ったのですが、実行時に
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte
と出てしまっています。これはどうしたら治せますか?お願いします。
python
1import gensim 2import torch 3from tensorboardX import SummaryWriter 4 5vec_path = "twocities.model" 6 7writer = SummaryWriter() 8model= gensim.models.KeyedVectors.load_word2vec_format(vec_path, binary=True) 9weights = model.vectors 10labels = model.index2word 11 12writer.add_embedding(torch.FloatTensor(weights),metadata=labels) 13