回答編集履歴

2

修正

2021/02/27 07:56

投稿

退会済みユーザー
test CHANGED
@@ -144,7 +144,7 @@
144
144
 
145
145
   ↓
146
146
 
147
- main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。Agemt#learn関数の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
147
+ main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。`Agent#learn()`の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
148
148
 
149
149
  「 critic_value = tf.squeeze(self.critic(states, actions), 1)」
150
150
 

1

修正

2021/02/27 07:56

投稿

退会済みユーザー
test CHANGED
@@ -144,7 +144,7 @@
144
144
 
145
145
   ↓
146
146
 
147
- main_ddpg.py の`learn()`[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]関数の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
147
+ main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。Agemt#learn関数の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
148
148
 
149
149
  「 critic_value = tf.squeeze(self.critic(states, actions), 1)」
150
150