質問編集履歴
3
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -35,3 +35,9 @@
|
|
35
35
|
他に(これが原因じゃね? 強化学習でcnnを使う場合こういう手法を使わなきゃいけない)みたいな感じのあったら教えてください
|
36
36
|
|
37
37
|
情報が足りなければいってください(コードをすべて乗せるのは文字数的にできません 一枚完結じゃないし)
|
38
|
+
|
39
|
+
|
40
|
+
|
41
|
+
追記
|
42
|
+
|
43
|
+
正直 原因がわからなさ過ぎてなんの情報を載せたらいいかわからない状態です この質問がよくなくても低評価だけ付けられても直せません 低評価の原因になるようなところがあれば具体的に言ってください
|
2
変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
c
|
1
|
+
pytorchで強化学習をやってるのですが Gradient overflowといわれ出力が nan になります
|
test
CHANGED
File without changes
|
1
誤字
test
CHANGED
File without changes
|
test
CHANGED
@@ -26,7 +26,7 @@
|
|
26
26
|
|
27
27
|
自分なりに考えた結果
|
28
28
|
|
29
|
-
q(s,a)-Reward+(g
|
29
|
+
q(s,a)-Reward+(gnmma*q(s+1,a)) の式
|
30
30
|
|
31
31
|
のところで画像があまり変わらないため値が同じになってるのが原因?
|
32
32
|
|