質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

674閲覧

Doc2Vecのモデルを読み込めるようになりたいです。

IA_AI

総合スコア1

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/11/28 16:11

前提

自然言語処理のDoc2Vecというモデルを扱おうと思っています。
モデルを読み込む際に以下のエラーメッセージが発生しました。
何卒宜しくお願い致します。

実現したいこと

エラーが発生することなくモデルの読み込みがしたいです。

発生している問題・エラーメッセージ

UnpicklingError: could not find MARK

該当のソースコード

Python

1import gensim 2from gensim.models.doc2vec import Doc2Vec 3 4#failenameのpathにはきちんとモデルが入っています。 5filename = './model/test/wikipedia_dbow.model' 6 7#下記のの読み込み箇所で上記のエラーメッセージが出ます。。 8model = gensim.models.doc2vec.Doc2Vec.load(filename)

試したこと

https://qiita.com/berry-clione/items/9fa6045a4046540c3d93
こちらのサイトを参考にしてみましたが、Word2Vec用なのでDoc2Vecではうまくいきませんでした。

補足情報(FW/ツールのバージョンなど)

https://note.ofxmp3.com/n/n46d7182cd5aa
こちらのサイトを参考にしました。
モデルの制作自体はできましたが、肝心のモデルを読み込むところがうまくいきません。

バージョン
Python 3.7.13
gensim 3.8.3

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2022/11/29 04:23

学習は、 https://note.ofxmp3.com/n/n46d7182cd5aa に書かれてる方法で、自分で行ったのでしょうか? それとも、上記のWebページから学習済みモデルを購入したのでしょうか?
jbpb0

2022/11/30 07:57

当方のmacで、 https://yag-ays.github.io/project/pretrained_doc2vec_wikipedia/ から「jawiki.doc2vec.dbow300d.tar.bz2」を落として展開し、含まれてた四つのファイルを「model」というディレクトリに置いて、質問のコードを filename = './model/test/wikipedia_dbow.model' ↓ 変更 filename = './model/jawiki.doc2vec.dbow300d.model' だけ変更して他はそのままで実行したら、gensim 4.2.0だと(この質問とは違う)エラーが出ましたが、gensim 3.8.3を入れたらエラー出ずに実行できました 以上、ご参考までに
guest

回答1

0

ベストアンサー

有料記事のようですから、直接問いあわせるのがいいと思いますよ。

不確実ですが、unpickleのエラーですから、提供されているモデル(pickleされている)を作ったモジュールのバージョンと、unpickleしようとしているモジュールのバージョンが異なるのが原因ではないかと思います。
どのバージョンならいけるのかは作者に問い合わせる必要がありますが、4年前の記事ということはそこそこ古いものになりますね。

投稿2022/11/29 02:23

TakaiY

総合スコア12666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

IA_AI

2022/11/30 07:20

ありがとうございます
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問