強化学習を勉強しています。参考書やホームページをみても以下の点が腑に落ちません。ご教授頂けると助かります。
・Q学習で最高の報酬を選択するやり方のイメージがつきません。
どういう手順でプログラムを組み立てるのでしょうか。
(総当たりで最高値を選択するのであれば簡単ですがそうではなさそうなので。)
・プログラムの目次を教えて欲しいです。
回答1件
あなたの回答
tips
プレビュー
投稿2020/12/20 01:16
編集2020/12/20 04:04強化学習を勉強しています。参考書やホームページをみても以下の点が腑に落ちません。ご教授頂けると助かります。
・Q学習で最高の報酬を選択するやり方のイメージがつきません。
どういう手順でプログラムを組み立てるのでしょうか。
(総当たりで最高値を選択するのであれば簡単ですがそうではなさそうなので。)
・プログラムの目次を教えて欲しいです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。