回答率: 85.35%

質問するログイン新規登録

トップに関する質問 DQNゴールの場所をランダムで変える

編集履歴

質問編集履歴

3

追加

2020/05/22 07:11

投稿

スコア22

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -18,7 +18,7 @@
 - エージェントにはゴールの座標(2,)エージェントの周辺(5,5)の画像のピクセルデータが合わせて(27,)の形で入力される
-- 300stepたったら強制終了目標座標到達で終了＆報酬+100(もしかして300stepで終了だからどの行動が根拠で高い報酬につながったかわからないから学習が進まない？)
+- 300stepたったら強制終了目標座標到達で終了＆報酬+100(もしかして300stepで終了だからどの行動が根拠で高い報酬につながったかわからないから学習が進まないと思い50stepにしたもののだめでした)
 - 毎ステップ報酬-1

2

補足

2020/05/22 07:11

投稿

スコア22

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -18,7 +18,7 @@
 - エージェントにはゴールの座標(2,)エージェントの周辺(5,5)の画像のピクセルデータが合わせて(27,)の形で入力される
-- 300stepたったら強制終了目標座標到達で終了＆報酬+100
+- 300stepたったら強制終了目標座標到達で終了＆報酬+100(もしかして300stepで終了だからどの行動が根拠で高い報酬につながったかわからないから学習が進まない？)
 - 毎ステップ報酬-1

1

報酬

2020/05/22 06:46

投稿

スコア22

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -18,6 +18,10 @@
 - エージェントにはゴールの座標(2,)エージェントの周辺(5,5)の画像のピクセルデータが合わせて(27,)の形で入力される
+- 300stepたったら強制終了目標座標到達で終了＆報酬+100
+- 毎ステップ報酬-1
 エージェントには自分の周りの風景で居場所を認識し、ゴールの座標の方へ移動する力が求められる。