強化学習を行い、出来たモデルを用いて性能評価を行いたいと思っています。
その際、使用するモデルとしてはどのタイミングで生成されたモデルを選択すればよろしいのでしょうか。
例えば、最終epoch時のモデルであったり、学習時に最大の報酬を得たepoch時のモデルが候補としては思いつくのですが、一般的な選択方法があれば教えていただけますでしょうか。
あなたの回答
tips
プレビュー
投稿2021/07/20 05:14
強化学習を行い、出来たモデルを用いて性能評価を行いたいと思っています。
その際、使用するモデルとしてはどのタイミングで生成されたモデルを選択すればよろしいのでしょうか。
例えば、最終epoch時のモデルであったり、学習時に最大の報酬を得たepoch時のモデルが候補としては思いつくのですが、一般的な選択方法があれば教えていただけますでしょうか。
あなたの回答
tips
プレビュー