回答編集履歴

修正

2021/02/27 07:56

投稿

スコア0

answer CHANGED Viewed

@@ -71,7 +71,7 @@
 　↓
 `Agent#__init__()`の中で、CriticNetworkがインスタンス化されます[質問文の（２）]
 　↓
-main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。Agemt#learn関数の中で、ddpg_tf2.pyの質問文にある（１）が呼び出されます。
+main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。`Agent#learn()`の中で、ddpg_tf2.pyの質問文にある（１）が呼び出されます。
 「 critic_value = tf.squeeze(self.critic(states, actions), 1)」
 ↓
 このとき、`self.critic(states, actions), 1)`という呼び出し方をしていることから、ここで**CriticNetworkの`__call__()`を呼びだすことになります。**

修正

2021/02/27 07:56

投稿

スコア0

answer CHANGED Viewed

@@ -71,7 +71,7 @@
 　↓
 `Agent#__init__()`の中で、CriticNetworkがインスタンス化されます[質問文の（２）]
 　↓
-main_ddpg.py の`learn()`[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]関数の中で、ddpg_tf2.pyの質問文にある（１）が呼び出されます。
+main_ddpg.py の中で`Agent#learn()`を呼び出しています。[[src](https://github.com/philtabor/Youtube-Code-Repository/blob/master/ReinforcementLearning/PolicyGradient/DDPG/tensorflow2/pendulum/main_ddpg.py#L26)]。Agemt#learn関数の中で、ddpg_tf2.pyの質問文にある（１）が呼び出されます。
 「 critic_value = tf.squeeze(self.critic(states, actions), 1)」
 ↓
 このとき、`self.critic(states, actions), 1)`という呼び出し方をしていることから、ここで**CriticNetworkの`__call__()`を呼びだすことになります。**