会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
kane's Blog
博客园
首页
新随笔
联系
订阅
管理
2024年5月23日
强化学习基础
摘要: bellman equation Bellman方程的主要作用是提供了一种递归的方法来计算值函数和动作值函数,从而帮助我们评估和优化策略。 对于值函数V(s), Bellman方程描述了当前状态的值与后续状态的值和即时奖励之间的关系。通过不断迭代更新值函数,我们可以逐步逼近最优值函数,并根据值函数来
阅读全文
posted @ 2024-05-23 17:31 kingchou007
阅读(4)
评论(0)
推荐(0)
编辑
公告