今現在三目並べでminimax法の改良版αβ法を作り終え、ここから次五目並べも作ろうかと思っているんですが
そのままαβ法で実装するかそれとも強化学習でやろうか悩んでいて
1.強化学習だとモンテカルロ法に手を付ける方が良いでしょうか?
2.αβ法でも五目並べは実装できるでしょうか?
人間 VS AIを今作っており人間に勝てるようなAIを実装したいと考えています。そのためにαβ法でも通じるのかそれともモンテカルロみたいに強化学習にした方がいいのか今悩んでおり質問させていただきました。
投稿2017/11/21 08:42
編集2017/11/21 16:09今現在三目並べでminimax法の改良版αβ法を作り終え、ここから次五目並べも作ろうかと思っているんですが
そのままαβ法で実装するかそれとも強化学習でやろうか悩んでいて
1.強化学習だとモンテカルロ法に手を付ける方が良いでしょうか?
2.αβ法でも五目並べは実装できるでしょうか?
人間 VS AIを今作っており人間に勝てるようなAIを実装したいと考えています。そのためにαβ法でも通じるのかそれともモンテカルロみたいに強化学習にした方がいいのか今悩んでおり質問させていただきました。