会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
kane's Blog
博客园
首页
新随笔
联系
订阅
管理
2024年5月23日
强化学习基础
摘要: bellman equation Bellman方程的主要作用是提供了一种递归的方法来计算值函数和动作值函数,从而帮助我们评估和优化策略。 对于值函数V(s), Bellman方程描述了当前状态的值与后续状态的值和即时奖励之间的关系。通过不断迭代更新值函数,我们可以逐步逼近最优值函数,并根据值函数来
阅读全文
posted @ 2024-05-23 17:31 kingchou007
阅读(4)
评论(0)
推荐(0)
编辑
公告