随笔分类 - 机器学习

HJB方程简述

摘要：参考资料：维基的哈密顿-雅克比-贝尔曼方程条目。有条件的同学可以自行查看，效果比本文要好一些。文末也会给出相关更深入的资料供大家学习。作为强化学习的一个基础思想，HJB方程从大框架概述了控制优化的方向。这里对其推导与应用进行简述。定义如下变量：为过程价值函数，其中S(t)为在t时刻的状态函数，A 阅读全文

posted @ 2022-12-18 22:14 Johnson-Hugo 阅读(2140) 评论(0) 推荐(0)

Johnson-Hugo

动脑筋是推进科学发展的动力之一，而勤奋、有机会就锻炼是增长我们能耐的好方法.人寿几何！我并不是说碰到所有的问题都想，而是说要经常动脑筋，来考验自己.——华罗庚

随笔分类 - 机器学习

公告