ターン制のボードゲームを学習させたいと考えています。今のところ、DQNを用いて、自己対局によって学習させようと考えているのですが、盤面(state)によって起こせる行動(action)が変化してしまうため、状態を入力とし、それぞれの行動の価値を出力するニューラルネットワークがつくれません。(出力層の数が一定でないので) どのようにすればよいのでしょうか。また、DQN以外で良い手法がある場合は教えていただきたいです。
あなたの回答
tips
プレビュー
Q&A
退会済みユーザー
総合スコア0
投稿2020/09/26 12:51
ターン制のボードゲームを学習させたいと考えています。今のところ、DQNを用いて、自己対局によって学習させようと考えているのですが、盤面(state)によって起こせる行動(action)が変化してしまうため、状態を入力とし、それぞれの行動の価値を出力するニューラルネットワークがつくれません。(出力層の数が一定でないので) どのようにすればよいのでしょうか。また、DQN以外で良い手法がある場合は教えていただきたいです。
あなたの回答
tips
プレビュー