OpenAI GymのMultiDiscrete()を使用したいのですが、うまく動作しません。
例えば、以下のURLのコードを例に取りますと、
https://qiita.com/inoory/items/e63ade6f21766c7c2393
ここで、gym.spaces.Discrete()をgym.spaces.MultiDiscrete()に変更します。
すると、actionはlist形式のものが返ってくることを期待しますが、実際print(action)をしてみますと、int型が返ってきます。
なぜでしょう。
MultiDiscreteの使い方をご存じの方がいらっしゃいましたら、ぜひともご教授ください。
####補足
env.action_space.sample()でランダムな値を生成するとちゃんとlist型が返ってきます。dqn.fit()で動かすと、int型が返ってくるのです。
####参考コード
https://github.com/openai/gym/blob/master/gym/spaces/multi_discrete.py
あなたの回答
tips
プレビュー