会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
芋圆院长
博客园
首页
新随笔
联系
订阅
管理
2023年4月18日
强化学习奖励函数的设置
摘要: 奖励奖励 强化学习中奖励函数设置不好,agent也得不到好的解。 ##确定奖励函数的注意事项 明确任务目标:一定要确保奖励函数和任务目标是一致的,否则可能会出现奖励函数引导 agent 在任务上取得不良的表现。 注意:因为算法目标是最大化奖励,所以需要看奖励和目标之间的关系。当我的奖励最大的时候,是
阅读全文
posted @ 2023-04-18 11:23 芋圆院长
阅读(380)
评论(0)
推荐(0)
编辑
公告