質問編集履歴

3

追記

2020/06/23 21:47

投稿

Flan.
Flan.

スコア123

test CHANGED
File without changes
test CHANGED
@@ -35,3 +35,9 @@
35
35
  他に(これが原因じゃね? 強化学習でcnnを使う場合こういう手法を使わなきゃいけない)みたいな感じのあったら教えてください
36
36
 
37
37
  情報が足りなければいってください(コードをすべて乗せるのは文字数的にできません 一枚完結じゃないし)
38
+
39
+
40
+
41
+ 追記
42
+
43
+ 正直 原因がわからなさ過ぎてなんの情報を載せたらいいかわからない状態です この質問がよくなくても低評価だけ付けられても直せません 低評価の原因になるようなところがあれば具体的に言ってください

2

変更

2020/06/23 21:47

投稿

Flan.
Flan.

スコア123

test CHANGED
@@ -1 +1 @@
1
- cnn(3,400,400)を使った強化学習 勾配が nan になります
1
+ pytorchで強化学習をやってるのですが Gradient overflowといわれ出力が nan になります
test CHANGED
File without changes

1

誤字

2020/06/23 21:40

投稿

Flan.
Flan.

スコア123

test CHANGED
File without changes
test CHANGED
@@ -26,7 +26,7 @@
26
26
 
27
27
  自分なりに考えた結果
28
28
 
29
- q(s,a)-Reward+(ganmm*q(s+1,a)) の式
29
+ q(s,a)-Reward+(gnmma*q(s+1,a)) の式
30
30
 
31
31
  のところで画像があまり変わらないため値が同じになってるのが原因?
32
32