回答編集履歴
1
d
test
CHANGED
@@ -13,3 +13,23 @@
|
|
13
13
|
|
14
14
|
|
15
15
|
その本は持っていないですが、書籍内に説明があると思います。
|
16
|
+
|
17
|
+
|
18
|
+
|
19
|
+
----
|
20
|
+
|
21
|
+
|
22
|
+
|
23
|
+
Github の書籍のレポジトリに全部のソースコードがあるので、そちらを参照してください。
|
24
|
+
|
25
|
+
|
26
|
+
|
27
|
+
transit_func() の定義
|
28
|
+
|
29
|
+
[baby-steps-of-rl-ja/bellman_equation.py](https://github.com/icoxfog417/baby-steps-of-rl-ja/blob/03066a755a167581f675a003a2e94c7d44782776/DP/bellman_equation.py)
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
reward_func() の定義
|
34
|
+
|
35
|
+
[baby-steps-of-rl-ja/environment.py](https://github.com/icoxfog417/baby-steps-of-rl-ja/blob/03066a755a167581f675a003a2e94c7d44782776/DP/environment.py)
|