回答率: 85.31%

質問するログイン新規登録

トップに関する質問教科書記載の、Q学習の一番基本的なコードの内容を理解したい。

編集履歴

質問編集履歴

3

分かりにくかったので修正しました。

2021/05/31 02:00

投稿

スコア23

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -2,6 +2,10 @@
 強化学習のQ学習の教科書の簡単なコードの内容を理解したいです。
+なお、教科書は下記のものになります。
+「行動データの計算論モデリング: 強化学習モデルを例として(片平健太郎著)」
 教科書のQ学習のコードの解読をしているのですが、「フィットするモデルの設定」より前の部分が果たしてる役割が、よく理解できていません。

2

分かりにくかったので修正しました。

2021/05/31 01:59

投稿

スコア23

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -314,7 +314,7 @@
-func_qlearning の定義がされる前の箇所で導出されたQの値が、「フィットするモデルの設定」に対して、どのように渡されて、どこで使われているのかが、分かりません。
+関数func_qlearning の定義がされる前の箇所で導出されたQの値が、「フィットするモデルの設定」に対して、どのように渡されて、どこで使われているのかが、分かりません。

1

分かりにくかったので修正しました。

2021/05/30 14:01

投稿

スコア23

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -314,7 +314,7 @@
-関数が始まる以前の箇所で導出されたQの値が、「フィットするモデルの設定」に対して、どのように渡されて、どこで使われているのかが、分かりません。
+func_qlearning の定義がされる前の箇所で導出されたQの値が、「フィットするモデルの設定」に対して、どのように渡されて、どこで使われているのかが、分かりません。