質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

強化学習

強化学習とは、ある環境下のエージェントが現状を推測し行動を決定することで報酬を獲得するという見解から、その報酬を最大限に得る方策を学ぶ機械学習のことを指します。問題解決時に得る報酬が選択結果によって変化することで、より良い行動を選択しようと学習する点が特徴です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

1回答

338閲覧

強化学習のテスト環境について

shimakon

総合スコア3

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

強化学習

強化学習とは、ある環境下のエージェントが現状を推測し行動を決定することで報酬を獲得するという見解から、その報酬を最大限に得る方策を学ぶ機械学習のことを指します。問題解決時に得る報酬が選択結果によって変化することで、より良い行動を選択しようと学習する点が特徴です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2021/07/13 09:11

質問内容

強化学習について勉強している中で気になることがあったのでこちらに質問させていただきます。
強化学習の適用例として、CartPoleやスーパーマリオなどの様々なゲームへの適用例が見受けられますが、
それらは全て学習環境とテスト環境が同一のものであると思われます。
深層学習での画像のClassificationでは学習用画像とは別にテスト画像を用意し、テスト画像に対する性能でAIの評価を行うのが一般的と認識していますが、強化学習ではこのような評価は行わず学習時と同一環境で評価するのが一般的なのでしょうか?(マリオの例で言うと、1-1ステージの環境で学習したAIマリオを1-2ステージで評価するといった感じです。そもそも強化学習とは学習した環境下でしか機能しないため、異なる環境で評価するのは的外れなことになるのでしょうか?)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

強化学習の環境と、深層学習のデータは、あまり同一視はできないと思います。
強化学習は基本的には、環境は与えられたもので、状態を持つものの、大枠(ゲームで言うところのルール)は不変なものです。一方、質問者様の言われるような、環境が変化する強化学習は、先端分野の1つとして研究されているようです。「強化学習 環境 変化」でググると関連の記述がたくさん得られます。

例: メタ強化学習を用いたダイナミクスの変化への適応
強化学習を実世界の問題に応用する上では、まだ多くの課題が残されています。その 1 つとして、環境の変化に脆弱であるという課題が挙げられます。・・・。この課題に対するアプローチの 1 つとして、・・・

投稿2021/07/13 13:02

toast-uz

総合スコア3266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問