kerns-rlで、エピソードごとのrewardはどの様にすれば確認できるのでしょうか?
memory.rewards.dataにステップごとのrewardが格納されていますが、エピソードごとのrewardを確認したい場合はどうすれば良いでしょうか?
testを実行した際に以下の様に表示されますが、ここでのrewardはエピソードを通してのrewardの合計ですよね?それをfitの際にも確認したいです。
Episode 1: reward: -6.000, steps: 50
Episode 2: reward: -10.000, steps: 50
Episode 3: reward: -15.000, steps: 50
Episode 4: reward: -6.000, steps: 50
あなたの回答
tips
プレビュー