参考書「Pythonで学ぶ強化学習　入門から実践まで」 code2-5が分からない

Question

強化学習について「Pythonで学ぶ強化学習　入門から実践まで(久保隆宏　著)」で勉強しているのですが、39ページでのcode2-5で躓いてしまいました。
上から4つ目のdefについて質問です。
```python
    def transitions_at(self, state, action):
        transition_probs = self.env.transit_func(state, action)
        for next_state in transition_probs:
            prob = transition_probs[next_state]
            reward, _ = self.env.reward_func(next_state)
            yield prob, next_state, reward
```
2行目 transit_func()　や、5行目 reward_func()　ってどんな内容の関数なのでしょうか？
python自体、まだ触り立ててで慣れていないのでどこか見落としがあるとは思うのですが、自分では気づけません。よろしくお願いします。

Accepted Answer

> 2行目 transit_func()　や、5行目 reward_func()　ってどんな内容の関数なのでしょうか？

Python の標準関数等でなく、書籍内に記載がある関数だと思います。
以下の Github から書籍に載っているコードをダウンロードできるようです。

[icoxfog417/baby-steps-of-rl-ja: Pythonで学ぶ強化学習 -入門から実践まで- サンプルコード](https://github.com/icoxfog417/baby-steps-of-rl-ja)

その本は持っていないですが、書籍内に説明があると思います。

----

Github の書籍のレポジトリに全部のソースコードがあるので、そちらを参照してください。

transit_func() の定義
[baby-steps-of-rl-ja/bellman_equation.py](https://github.com/icoxfog417/baby-steps-of-rl-ja/blob/03066a755a167581f675a003a2e94c7d44782776/DP/bellman_equation.py)

reward_func() の定義
[baby-steps-of-rl-ja/environment.py](https://github.com/icoxfog417/baby-steps-of-rl-ja/blob/03066a755a167581f675a003a2e94c7d44782776/DP/environment.py)

関連した質問