質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

OpenAI Gym

OpenAI Gymは、強化学習を開発・強化するためのシミュレーション環境です。強化学習における実験や評価環境などを標準化し提供することを目的としています。さらに、結果をアップロードしたり、他の人の実行結果や実装を見ることも可能です。

強化学習

強化学習とは、ある環境下のエージェントが現状を推測し行動を決定することで報酬を獲得するという見解から、その報酬を最大限に得る方策を学ぶ機械学習のことを指します。問題解決時に得る報酬が選択結果によって変化することで、より良い行動を選択しようと学習する点が特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

345閲覧

60次元観測をtensorflowのconv1Dを用いて6次元に圧縮したい

ume_t

総合スコア2

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

OpenAI Gym

OpenAI Gymは、強化学習を開発・強化するためのシミュレーション環境です。強化学習における実験や評価環境などを標準化し提供することを目的としています。さらに、結果をアップロードしたり、他の人の実行結果や実装を見ることも可能です。

強化学習

強化学習とは、ある環境下のエージェントが現状を推測し行動を決定することで報酬を獲得するという見解から、その報酬を最大限に得る方策を学ぶ機械学習のことを指します。問題解決時に得る報酬が選択結果によって変化することで、より良い行動を選択しようと学習する点が特徴です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

1クリップ

投稿2020/09/24 03:25

編集2020/09/25 02:14

OpenAIが提供しているSafetyGymという強化学習のシミュレーションツール群で安全な強化学習を研究しています。
SafetyGymのベンチマーク問題であるpoint-goalという問題の60次元の観測をVAEを用いて6次元に圧縮し研究している提案手法に入力したいと考えているのですが、エンコーダ部分の畳み込み層conv1Dの出力次元数をどの程度の度合いで小さくしていけばいいのかいろんなネット上の記事を見てみましたが適切な値がわかりません。


point-goal問題は赤色のロボットが青色のハザードになるべく侵入せず緑色のゴールに移動する事が目的の問題です。
point-goal問題の動作図

観測は強化学習サイクルのステップ毎に加速度、速度、ジャイロ、lidarによるゴールの位置など、合計60次元の観測がスカラー値で与えられます。


現時点ではネット記事を参考に以下のようにエンコーダ部分を構成しようと考えています。

Python

1 self.encoder = tf.keras.Sequential( 2 [ 3 tf.keras.layers.InputLayer(input_shape=(60,)), 4 tf.keras.layers.Conv1D( 5 filters=60, kernel_size=8, strides=2, activation='liner'), 6 tf.keras.layers.Conv1D( 7 filters=30, kernel_size=8, strides=2, activation='liner'), 8 tf.keras.layers.Flatten(), 9 tf.keras.layers.Dense(6), 10 ] 11 ) 12

ですが、画像データではないという点やVAEを使うという点からもっとこういう構成ががよいというアドバイスがありましたら、ぜひお願いします。

※2020/9/25 conv1Dについて勘違いをしており、コードの構成を変更しました。変更後でもこの層の組み合わせについてこれが適切なのかわかりません。知識のある方、お時間がありましたらご回答よろしくお願いします。

退会済みユーザー👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問