質問編集履歴
1
誤字
test
CHANGED
File without changes
|
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
自作で強化学習の環境を作り、keras-rlでDQNの実装をしているのですが、memory.actions.dataに格納されているアクションはそれぞれのステップでとったアクションを格納しているわけでは無いのでしょうか?試しに環境のs
|
1
|
+
自作で強化学習の環境を作り、keras-rlでDQNの実装をしているのですが、memory.actions.dataに格納されているアクションはそれぞれのステップでとったアクションを格納しているわけでは無いのでしょうか?試しに環境のstep関数の中で毎回の引数になっているactionを配列に格納して、memory.actions.dataと比較したところ、所々同じですが、値が違いました。何故この様なことが起きるのでしょうか?
|