回答編集履歴
1
typo
test
CHANGED
@@ -30,13 +30,13 @@
|
|
30
30
|
|
31
31
|
恐らく、上記動作は`Q学習`に期待する動作とは異なるのですよね?
|
32
32
|
|
33
|
-
ということは正しい動作をa_a_a_a_a_a_a_さんはご存知ということですから、正しく動作した場合
|
33
|
+
ということは正しい動作をa_a_a_a_a_a_a_さんはご存知ということですから、正しく動作した場合に期待される値と異なる原因を探せばよいです。
|
34
34
|
|
35
35
|
そのためにはnextdirectionへ値を設定している前後で、nextdirection値を求めるために使っている変数群をprintf()してみて、期待する値かどうかを確認します。
|
36
36
|
|
37
|
-
期待しない値になっている変数を設定している前後で、その値を求めるために使っている変数群をprintf()してみます。
|
37
|
+
そして、期待しない値になっている変数を設定している前後で、その値を求めるために使っている変数群をprintf()してみます。
|
38
38
|
|
39
|
-
これらを繰り返すことで、期待と異なる値を
|
39
|
+
これらを繰り返すことで、期待と異なる値を設定している原因を見つけることができると思います。
|
40
40
|
|
41
41
|
|
42
42
|
|