前提・実現したいこと
pythonでQ学習を実装しようとしています。
Qテーブルを作成したのですが、参照の方法が分かりません。
多次元配列で1次元が特定のものので2次元も特定のものの時の3次元を参照したいです。
発生している問題
q_table =np.array([[diff_list,p1],action])
diff_list=(-900,-800,-700,-600,-500,-400,-300,-200,-100,0,100,200,300,400,500,600,700,800,900)
p1 = ('ロイヤルストレートフラッシュ','ストレートフラッシュ','4カード','フルハウス','フラッシュ','ストレート','3カード','2ペア','1ペア','ぶた')
action = [0.5,05]
このようなQテーブルを作成して、actionについて更新していきたいのですが
q_table[1][0]といった風に記述するとactionを参照することができるのですが、
diff_list = -800 p1 = 'ストレート' の時のaction[0]を参照したいです。
補足情報(FW/ツールのバージョンなど)
pythonを使用して書いています。
あなたの回答
tips
プレビュー