質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.12%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

Doc2Vecのモデルを読み込めるようになりたいです。

IA_AI
IA_AI

総合スコア1

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0グッド

0クリップ

180閲覧

投稿2022/11/28 16:11

前提

自然言語処理のDoc2Vecというモデルを扱おうと思っています。
モデルを読み込む際に以下のエラーメッセージが発生しました。
何卒宜しくお願い致します。

実現したいこと

エラーが発生することなくモデルの読み込みがしたいです。

発生している問題・エラーメッセージ

UnpicklingError: could not find MARK

該当のソースコード

Python

1import gensim 2from gensim.models.doc2vec import Doc2Vec 3 4#failenameのpathにはきちんとモデルが入っています。 5filename = './model/test/wikipedia_dbow.model' 6 7#下記のの読み込み箇所で上記のエラーメッセージが出ます。。 8model = gensim.models.doc2vec.Doc2Vec.load(filename)

試したこと

https://qiita.com/berry-clione/items/9fa6045a4046540c3d93
こちらのサイトを参考にしてみましたが、Word2Vec用なのでDoc2Vecではうまくいきませんでした。

補足情報(FW/ツールのバージョンなど)

https://note.ofxmp3.com/n/n46d7182cd5aa
こちらのサイトを参考にしました。
モデルの制作自体はできましたが、肝心のモデルを読み込むところがうまくいきません。

バージョン
Python 3.7.13
gensim 3.8.3

以下のような質問にはグッドを送りましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

グッドが多くついた質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

jbpb0

2022/11/29 04:23

学習は、 https://note.ofxmp3.com/n/n46d7182cd5aa に書かれてる方法で、自分で行ったのでしょうか? それとも、上記のWebページから学習済みモデルを購入したのでしょうか?
jbpb0

2022/11/30 07:57

当方のmacで、 https://yag-ays.github.io/project/pretrained_doc2vec_wikipedia/ から「jawiki.doc2vec.dbow300d.tar.bz2」を落として展開し、含まれてた四つのファイルを「model」というディレクトリに置いて、質問のコードを filename = './model/test/wikipedia_dbow.model' ↓ 変更 filename = './model/jawiki.doc2vec.dbow300d.model' だけ変更して他はそのままで実行したら、gensim 4.2.0だと(この質問とは違う)エラーが出ましたが、gensim 3.8.3を入れたらエラー出ずに実行できました 以上、ご参考までに

回答1

0

ベストアンサー

有料記事のようですから、直接問いあわせるのがいいと思いますよ。

不確実ですが、unpickleのエラーですから、提供されているモデル(pickleされている)を作ったモジュールのバージョンと、unpickleしようとしているモジュールのバージョンが異なるのが原因ではないかと思います。
どのバージョンならいけるのかは作者に問い合わせる必要がありますが、4年前の記事ということはそこそこ古いものになりますね。

投稿2022/11/29 02:23

TakaiY

総合スコア10467

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

IA_AI

2022/11/30 07:20

ありがとうございます

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.12%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。