初心者です。パソコンがモデル作成で重くなってしまっているので、スマホからの投稿になってしまいます。申し訳ございません。
参考書やネットの記事を元に、Wikipediaの全文データをもとにword2vec用のモデル作成を行っております。
loggingを使って状況を確認できるコードにしてあるのですが、90時間経って、EPOCH1の58.1%という状況で、本当に終わるのか?という状況です。
長くても40時間ほどで終わっているという記事が多い中、さすがにおかしいかと思っています...
PCのスペックが高い訳ではないからなのでしょうか?
(全文ではなく、571個のテキストファイルのうち1個だけで試しにモデル作成を行った際は、最後まできちんと出来ました。その時、EPOCHが1だけではなく3くらいまでいっていたので、とてつもない時間がかかるのではないかと思って不安です。)
【環境】
Windows10
Python3.8
gensim
cython(早くなると聞いたので)
(WSLとしてUbuntuを入れて、neologd辞書を入れました。Windows上にコピーしてそれを元に分かち書きをした、テキストデータ(5.5GB)を使っています。)
【知りたいこと】
①このまま1ヶ月とか放置すれば多分完成はするのでしょうが、なんとか早める方法はないでしょうか?
②Google colaboratoryを利用しても、モデル作成は可能でしょうか?PCの性能に依存しなければ早くなるかと思いまして...
③そもそも、EPOCHとはなんなのでしょうか?学習の回数という認識であっていますか?
長い文章になってしまい申し訳ないのですが、回答よろしくお願いします。
回答1件
あなたの回答
tips
プレビュー