###前提・実現したいこと
強化学習(sarsa,Q学習)を学んでいます。
キャラクターをxy座標の連続な空間上で動かそうと思っています。
まず連続の状態を離散状態に関数近似を行う必要があると知り、調べたところタイルコーディング(CMAC)というものがありました。
しかし、実装の方法がわかりません。
複数のタイルを図のように設置して、ロボットが今どこにいるかを座標とタイル番号で知りたいです。
元となるxy座標をspace_index = x / (X座標を区切る幅) + y / (Y座標を区切る幅) * (X座標を区切る数)という式で分割しています。
ここにプラスして新たに空間分割のためのタイルを設置したいと考えています。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。