回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップ Windows 10に関する質問

Q&A

1回答

2963閲覧

UnicodeDecodeErrorを解決したい

総合スコア1

0グッド

0クリップ

投稿2020/09/30 16:09

0

0

前提・実現したいこと

word2vec学習済みモデルをtensorboardで可視化しようとしています。
モデルのファイルの名前はtwocities.modelです。
以下のコードでrunsというファイルを作ったのですが、実行時に
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte
と出てしまっています。これはどうしたら治せますか？お願いします。

python
1import gensim 
2import torch
3from tensorboardX import SummaryWriter
4
5vec_path = "twocities.model"
6
7writer = SummaryWriter()
8model= gensim.models.KeyedVectors.load_word2vec_format(vec_path, binary=True)
9weights = model.vectors
10labels = model.index2word
11
12writer.add_embedding(torch.FloatTensor(weights),metadata=labels)
13

2020/10/01 00:01

エラーはtracebackを含めて載せましょう

行動規範の内容に同意します

回答1件

0

https://qiita.com/omuram/items/6570973c090c6f0cb060
こちらが近いかと思います。
または、シバンに

# -*- coding: utf-8 -*-

を書いてコードでutf-8を使うことを明示的にするのはどうでしょうか。

投稿2020/10/01 01:39

総合スコア446

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Windows 10に関する質問

UnicodeDecodeErrorを解決したい

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る