前提・実現したいこと
一般的に自分の知っている範囲では、action spaceを増やし出力の強度を調節する方法はありますが、
それではaction spaceを増やしすぎると学習がうまく行かなくなり、
更に離散的で連続的に出力の強度の調節を行うことができません。
そこで、人間が力の入れ具合を調節するように連続的に出力の強度を調節する方法はあるのでしょうか?
具体的にPendulumを例に上げると、以下の表のように5段階で出力強度を調整する方法などが見られます。
しかし、これを-2.0~2.0の間で適切な出力強度を選択できるようなアルゴリズムは存在しているかということです。
Pendulumのwiki
action number | Joint effort |
---|---|
0 | -2.0 |
1 | -1.0 |
2 | 0.0 |
3 | +1.0 |
4 | +2.0 |
存在しないと完全に断言できなくてもいいので、一般的に見られないのかを教えていただければありがたいです。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。