↓のコードは以前違う質問した時に教えてもらってコード(minimax法)なのですが
いくつかわからない点がありご教授願いたいとおもいます。
1. update(move)というのがどういう動きなのかわからずfor move in moves の時に盤の情報を更新しているとおもったのですがまた違うのでしょうか?
2. moves = generate_moves(board) では指し手を生成した後の盤のリストを渡すという認識で大丈夫でしょうか?
- evaluate_moveでは 自分の手の石が3つならんでたら評価値+1 、相手の手の石が3つ並んでたら評価-1、引き分けなら0というふうにしようと考えているのですが、間違っていないでしょうか?
4. value = max_search(update(move),depth+1,target)や value = min_search(update(move),depth+1,target) の所では
evaluate_move関数を呼ばずにどうやってvalue値を決めるのかがわからなくてご教授願いたいです。。。
質問が多くなってしまいましたがよろしくお願いします。
def min_search(board,depth,target): moves = generate_moves(board) #指し手の生成 min_move = 1000000 if depth != target: for move in moves: value = max_search(update(move),depth+1,target) if value < min_move: min_move = value else: for move in moves: value = evaluate_move(update(move)) if value < min_move: min_move = value return min_move def max_search(board,depth,target): moves = generate_moves(board) print(moves) max_move = -1000000 best_move = moves[0][0] if depth != target: moves = generate_moves(board) for move in moves: value = min_search(update(move),depth+1,target) if value > max_move: max_move = value best_move = move else: for move in moves: value = evaluate_move(update(move)) #評価 if value > max_move: max_move = value best_move = move return best_move if depth == 1 else max_move def min_max(target): return max_search(board,1,target) def generate_moves(board): county = 0 for y in range(4): if county == 1: break for x in range(4): if board[y][x] == -1: board[y][x] = 0 countx = 0 county = county + 1 countx = countx + 1 if countx == 1: break return board def evaluate_move(move): #実装 #3つ自分の石がならんでたら+1 #3つ相手の石がならんでたら-1 #それ以外の場合0に実装予定 if __name__ == '__main__': best_move = min_max(5)#5手探索