2022-01-09から1日間の記事一覧

深層学習メモ 強化学習

ベルマン方程式 動的計画法として知られる数的最適化において、最適化の条件を示す式。 状態 x を外部からの入力 u で制御できると考えているときに、ある種の評価 J の下で u を色々変えてみて、いざ評価 J を最も良くするような u が見つかったときに成り…