強化学習の学習済みデータの保存に関する質問です

前提・実現したいこと

強化学習の学習済みデータの保存に関する質問です
https://www.tensorflow.org/agents/tutorials/5_replay_buffers_tutorial
上記のサイトを参考に強化学習を行う際のtensorflowの使用方法を勉強しているのですが、ページ下部のトレーニング中のリプレイバッファの使用のデータ収集の項目で
replay_observer = [replay_buffer.add_batch]
としているのですが、このデータを別ファイルなどに保存して、再度学習する際に利用するといったことを行いたいです。
どのようにコードを書けば良いでしょうか。

該当のソースコード

python
1
2env = suite_gym.load('CartPole-v0')
3tf_env = tf_py_environment.TFPyEnvironment(env)
4
5q_net = q_network.QNetwork(
6    tf_env.time_step_spec().observation,
7    tf_env.action_spec(),
8    fc_layer_params=(100,))
9
10agent = dqn_agent.DqnAgent(
11    tf_env.time_step_spec(),
12    tf_env.action_spec(),
13    q_network=q_net,
14    optimizer=tf.compat.v1.train.AdamOptimizer(0.001))
15
16replay_buffer_capacity = 1000
17
18replay_buffer = tf_uniform_replay_buffer.TFUniformReplayBuffer(
19    agent.collect_data_spec,
20    batch_size=tf_env.batch_size,
21    max_length=replay_buffer_capacity)
22
23# Add an observer that adds to the replay buffer:
24replay_observer = [replay_buffer.add_batch]
25
26collect_steps_per_iteration = 10
27collect_op = dynamic_step_driver.DynamicStepDriver(
28  tf_env,
29  agent.collect_policy,
30  observers=replay_observer,
31  num_steps=collect_steps_per_iteration).run()

行動規範の内容に同意します

回答1件

ベストアンサー

一番簡単な手法は、Pickleを使用して、
変数を丸々保存する方法です。

Pickle使用方法

pickle書き出し

python
1import pickle
2with open('dump.pk', 'wb') as f:
3  pickle.dump(replay_observer , f)

pickle読み込み

python
1import pickle
2with open('dump.pk', 'rb') as f:
3  replay_observer = pickle.load(f)

投稿2020/11/04 02:46

Moineau26518805

総合スコア44

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

強化学習の学習済みデータの保存に関する質問です

前提・実現したいこと

該当のソースコード

関連した質問