強化学習

rss_feed

強化学習とは、ある環境下のエージェントが現状を推測し行動を決定することで報酬を獲得するという見解から、その報酬を最大限に得る方策を学ぶ機械学習のことを指します。問題解決時に得る報酬が選択結果によって変化することで、より良い行動を選択しようと学習する点が特徴です。

  • 新着

  • アクティブ

  • 未回答

  • 未解決

  • 注目

  • 解決済

  • 受付中

    回答
    0

    強化学習時の評価に用いるモデル選択

    • 0評価
    • 0クリップ
    • 65PV
    teratailが 3日前 アップデート
  • 受付中

    回答
    1

    ML-Agentsでの学習時にエージェントが動かない

    • 0評価
    • 0クリップ
    • 90PV
    Bongo Bongo 6日前 回答
  • 受付中

    回答
    0

    DQN学習時のQ関数の発散

    • 0評価
    • 0クリップ
    • 75PV
    teratailが 1週間前 アップデート
  • 解決済

    回答
    1

    強化学習のテスト環境について

    • 0評価
    • 0クリップ
    • 40PV
    toast-uz toast-uz 1週間前 ベストアンサー
  • 解決済

    回答
    1

    numpy.whereでエージェントの初期位置のインデックスを決定したいです

    • 0評価
    • 0クリップ
    • 71PV
    tebask tebask 2週間前 コメント
  • 解決済

    回答
    2

    pythonによるURL機械学習

    • -1評価
    • 0クリップ
    • 188PV
    nnkkmto nnkkmto 1週間前 ベストアンサー
  • 解決済

    回答
    1

    no suitable method found to overrideの解決(unity ml-agents)

    • 0評価
    • 0クリップ
    • 195PV
    ft_ ft_ 3週間前 コメント
  • 解決済

    回答
    2

    'scipy.misc'に'imresize'がないってどういうことですか?(pythonでの画像のサイズ変更)

    • 0評価
    • 0クリップ
    • 133PV
    Flan. Flan. 1ヶ月前 ベストアンサー
  • 受付中

    回答
    0

    python opengymの並列化

    • 0評価
    • 0クリップ
    • 78PV
    Flan. Flan. 1ヶ月前 質問を編集
  • 受付中

    回答
    0

    NASのRNNをKerasで実装したい

    • -1評価
    • 0クリップ
    • 82PV
    XY_ XY_ 1ヶ月前 質問を編集
  • 受付中

    回答
    1

    No overload for method 'Perceive' takes 5 arguments(unity mlagents)

    • 0評価
    • 0クリップ
    • 93PV
    ft_ ft_ 1ヶ月前 質問を編集
  • 解決済

    回答
    3

    plt.plotの[]の意味

    • 0評価
    • 0クリップ
    • 243PV
    KURORO KURORO 1ヶ月前 コメント
  • 解決済

    回答
    1

    教科書記載の、Q学習の一番基本的なコードの内容を理解したい。

    • 0評価
    • 0クリップ
    • 168PV
    YYJP YYJP 1ヶ月前 ベストアンサー
  • 受付中

    回答
    0

    SARSA法による強化学習

    • 0評価
    • 0クリップ
    • 98PV
    teratailが 1ヶ月前 アップデート
  • 受付中

    回答
    0

    Anacondaでの強化学習について

    • 0評価
    • 0クリップ
    • 86PV
    teratailが 1ヶ月前 アップデート
  • 解決済

    回答
    1

    Unity ml-agents 学習できない Couldn't connect

    • 1評価
    • 1クリップ
    • 1841PV
    kathmandu kathmandu 2ヶ月前 回答
  • 解決済

    回答
    1

    統計Rの関数が実行されない

    • 0評価
    • 0クリップ
    • 142PV
    YYJP YYJP 2ヶ月前 ベストアンサー
  • 解決済

    回答
    1

    統計Rで、変数の値を変えても、出力結果が変わらない。

    • 0評価
    • 0クリップ
    • 175PV
    YYJP YYJP 2ヶ月前 コメント
  • 解決済

    回答
    1

    統計Rで、不正な文字列を指摘されるものの、指摘された行はコメントアウト済である。

    • 0評価
    • 0クリップ
    • 153PV
    YYJP YYJP 2ヶ月前 コメント
  • 受付中

    回答
    0

    unity 強化学習 モデルファイルについて(.nn .onnx)

    • 0評価
    • 0クリップ
    • 113PV
    teratailが 2ヶ月前 アップデート
タグ情報
  • あなたの順位
    -
  • タグ登録者数
    48
  • 総質問数
    154
  • 今週の質問数
    1

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る