質問内容
強化学習について勉強している中で気になることがあったのでこちらに質問させていただきます。
強化学習の適用例として、CartPoleやスーパーマリオなどの様々なゲームへの適用例が見受けられますが、
それらは全て学習環境とテスト環境が同一のものであると思われます。
深層学習での画像のClassificationでは学習用画像とは別にテスト画像を用意し、テスト画像に対する性能でAIの評価を行うのが一般的と認識していますが、強化学習ではこのような評価は行わず学習時と同一環境で評価するのが一般的なのでしょうか?(マリオの例で言うと、1-1ステージの環境で学習したAIマリオを1-2ステージで評価するといった感じです。そもそも強化学習とは学習した環境下でしか機能しないため、異なる環境で評価するのは的外れなことになるのでしょうか?)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。