回答編集履歴
2
修正
test
CHANGED
@@ -144,7 +144,7 @@
|
|
144
144
|
|
145
145
|
↓
|
146
146
|
|
147
|
-
main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。Age
|
147
|
+
main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。`Agent#learn()`の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
|
148
148
|
|
149
149
|
「 critic_value = tf.squeeze(self.critic(states, actions), 1)」
|
150
150
|
|
1
修正
test
CHANGED
@@ -144,7 +144,7 @@
|
|
144
144
|
|
145
145
|
↓
|
146
146
|
|
147
|
-
main_ddpg.py の`learn()`[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]関数の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
|
147
|
+
main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。Agemt#learn関数の中で、ddpg_tf2.pyの質問文にある(1)が呼び出されます。
|
148
148
|
|
149
149
|
「 critic_value = tf.squeeze(self.critic(states, actions), 1)」
|
150
150
|
|