python opengymの並列化

opengymで環境を並列化するにはどうすればいいですか？
このままでは環境を並列化させているアルゴリズム（A3c ape-x R2D2）
をgymで試せません


import gym
import numpy as np
#Pendulum-v0
#Breakout-v0
env = gym.make('Pendulum-v0')
env.reset()
for i in range(2000):
    env.render()
    action=env.action_space.sample()
    observation, reward, done, info = env.step(action)
    print(observation.shape,action,reward)
    if done:
        env.reset()

並列化なしでは動きます
DQNでの学習は成功しています

理想としては

observation, reward, done, info = env.step(action)
action.shape=[バッチ,アクション]
observation.shape=[バッチ,入力サイズ]
reward.shape=[バッチ,1]

こういう風になっくれるとうれしいです

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

python opengymの並列化

関連した質問