回答編集履歴
1
d
answer
CHANGED
@@ -5,4 +5,14 @@
|
|
5
5
|
|
6
6
|
[icoxfog417/baby-steps-of-rl-ja: Pythonで学ぶ強化学習 -入門から実践まで- サンプルコード](https://github.com/icoxfog417/baby-steps-of-rl-ja)
|
7
7
|
|
8
|
-
その本は持っていないですが、書籍内に説明があると思います。
|
8
|
+
その本は持っていないですが、書籍内に説明があると思います。
|
9
|
+
|
10
|
+
----
|
11
|
+
|
12
|
+
Github の書籍のレポジトリに全部のソースコードがあるので、そちらを参照してください。
|
13
|
+
|
14
|
+
transit_func() の定義
|
15
|
+
[baby-steps-of-rl-ja/bellman_equation.py](https://github.com/icoxfog417/baby-steps-of-rl-ja/blob/03066a755a167581f675a003a2e94c7d44782776/DP/bellman_equation.py)
|
16
|
+
|
17
|
+
reward_func() の定義
|
18
|
+
[baby-steps-of-rl-ja/environment.py](https://github.com/icoxfog417/baby-steps-of-rl-ja/blob/03066a755a167581f675a003a2e94c7d44782776/DP/environment.py)
|