回答編集履歴
1
typo
answer
CHANGED
@@ -14,10 +14,10 @@
|
|
14
14
|
そのような実作業はa_a_a_a_a_a_a_さんご自身で実施された方がよいと思います。
|
15
15
|
|
16
16
|
恐らく、上記動作は`Q学習`に期待する動作とは異なるのですよね?
|
17
|
-
ということは正しい動作をa_a_a_a_a_a_a_さんはご存知ということですから、正しく動作した場合
|
17
|
+
ということは正しい動作をa_a_a_a_a_a_a_さんはご存知ということですから、正しく動作した場合に期待される値と異なる原因を探せばよいです。
|
18
18
|
そのためにはnextdirectionへ値を設定している前後で、nextdirection値を求めるために使っている変数群をprintf()してみて、期待する値かどうかを確認します。
|
19
|
-
期待しない値になっている変数を設定している前後で、その値を求めるために使っている変数群をprintf()してみます。
|
19
|
+
そして、期待しない値になっている変数を設定している前後で、その値を求めるために使っている変数群をprintf()してみます。
|
20
|
-
これらを繰り返すことで、期待と異なる値を
|
20
|
+
これらを繰り返すことで、期待と異なる値を設定している原因を見つけることができると思います。
|
21
21
|
|
22
22
|
Q学習のアルゴリズムを適切に理解できている場合、経験上、ちょっとしたミスが多いです。例えば、足すべき時に引いているなど。
|
23
23
|
頑張って下さい。
|