回答編集履歴

修正

2020/10/03 17:42

投稿

スコア21956

test CHANGED Viewed

@@ -6,7 +6,9 @@
-例えば、**DDPG (deep deterministic policy gradient)** のような方策勾配法ベースのアルゴリズムです。質問の例ですと、モデルの出力は [-2, 2] の実数になります。
+例えば、**DDPG (deep deterministic policy gradient)** のような方策勾配法ベースのアルゴリズムです。Github で検索すると、実装例も出てきます。
+質問の例ですと、モデルの出力は [-2, 2] の実数になります。