前提・実現したいこと
迷路問題を強化学習で学習した際の学習データを利用して、異なる迷路の学習に役立てるプログラムが作成したいです。
おそらくニューラルネットワークの重みなどをを記録しておいて利用するかたちになると思うのですが、プログラミングなどの知識がなくて実装できずにいます。
知見やアイデアがある方、ご協力お願いします。
現時点のコード
https://github.com/gallardo22/DQN-chainer
補足情報(FW/ツールのバージョンなど)
processing 3.4
python anaconda3-4.4.0
numpy 1.15.1
chainer 5.0.0(ニューラルネットワーク動かすためのもの)
pyautogui 0.9.38(キーボード操作、ディスプレイ内の画像検索するため)
あなたの回答
tips
プレビュー