回答編集履歴

1

修正

2020/10/03 17:42

投稿

tiitoi
tiitoi

スコア21956

test CHANGED
@@ -6,7 +6,9 @@
6
6
 
7
7
 
8
8
 
9
- 例えば、**DDPG (deep deterministic policy gradient)** のような方策勾配法ベースのアルゴリズムです。質問の例ですと、モデルの力は [-2, 2] の実数になります。
9
+ 例えば、**DDPG (deep deterministic policy gradient)** のような方策勾配法ベースのアルゴリズムです。Github 検索と、実装例もてきます。
10
+
11
+ 質問の例ですと、モデルの出力は [-2, 2] の実数になります。
10
12
 
11
13
 
12
14