回答率: 85.35%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.35%

トップ TensorFlowに関する質問

Q&A

解決済

1回答

1475閲覧

DQNゴールの場所をランダムで変える

総合スコア22

0グッド

0クリップ

投稿2020/05/22 03:35

編集2020/05/22 07:11

0

0

前提・実現したいこと

DQNを利用してゴールの場所をランダムに変更してその特定の場所へたどり着けるようなモデルを作りたいです。
しかしながら何度学習を続けても全く報酬が増えません。
今回はDRQNを利用し学習を行いました。

gymの環境情報

50x50マスの絵の書かれたMAP上を上下左右にエージェントが移動する
エージェントにはゴールの座標(2,)エージェントの周辺(5,5)の画像のピクセルデータが合わせて(27,)の形で入力される
300stepたったら強制終了目標座標到達で終了＆報酬+100(もしかして300stepで終了だからどの行動が根拠で高い報酬につながったかわからないから学習が進まないと思い50stepにしたもののだめでした)
毎ステップ報酬-1

エージェントには自分の周りの風景で居場所を認識し、ゴールの座標の方へ移動する力が求められる。

補足情報（FW/ツールのバージョンなど）

keras-rlを利用して学習 openAIgymで環境を自作

行動規範の内容に同意します

回答1件

0

自己解決

MAPサイズを16x16にしたらいけました

投稿2020/05/23 07:44

総合スコア22

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ TensorFlowに関する質問

DQNゴールの場所をランダムで変える

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【ジャック広告の配信について】現在、非ログイン状態のユーザー様に対して一部の地域限定でジャック広告を配信しております。詳細につきましてはteratailブログをご確認ください。 https://blog.teratail.com/entry/jack-ad-202412

過去のお知らせを見る