質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

Q&A

解決済

1回答

526閲覧

keras-rlとopenAI gymについてです。

Hayato1201

総合スコア220

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

0グッド

0クリップ

投稿2018/03/14 03:23

この二つを使ったDQNの実装を試みるため、以下のサイトなどを参考に勉強しているのですが、それについて質問です。
https://qiita.com/inoory/items/e63ade6f21766c7c2393

最初のクラスの宣言時に、

self.action_space = gym.spaces.Discrete(3) # 行動空間。速度を下げる、そのまま、上げるの3種 high = np.array([1.0, 1.0]) # 観測空間(state)の次元 (位置と速度の2次元) とそれらの最大値 self.observation_space = gym.spaces.Box(low=-high, high=high) # 最小値は、最大値のマイナスがけ

と書かれていますが、速度を下げる、そのまま、上げるの3種とあるのにこれってアクションの種類とその範囲しか示されていない様に見えるのですがどうなのでしょうか?その下のstep関数では、actionを受け取りますが、これはどう言った値なのでしょうか?

ーーーーーーーーーーー
回答依頼をさせて頂いた方へ
今回も申し訳ありません、依頼させていただきますが、もし時間がある様ならばお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

self.action_space = gym.spaces.Discrete(3)
なので、
actionは0, 1, 2を取りえます。
https://github.com/openai/gym/blob/master/gym/spaces/discrete.py#L15

acc = (action - 1) * 0.1
なので、
accはそれぞれ-0.1, 0, 0.1になります。

投稿2018/03/14 04:32

mkgrei

総合スコア8560

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Hayato1201

2018/03/15 02:06

あ、今理解しました! 今回も回答ありがとうございました! 現在keras-rlを使ってプログラムを書いているのですが、何かと壁が多く、今後も質問させていただくと思うので、何卒お願いいたします。。。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問