摘要: 奖励奖励 强化学习中奖励函数设置不好,agent也得不到好的解。 ##确定奖励函数的注意事项 明确任务目标:一定要确保奖励函数和任务目标是一致的,否则可能会出现奖励函数引导 agent 在任务上取得不良的表现。 注意:因为算法目标是最大化奖励,所以需要看奖励和目标之间的关系。当我的奖励最大的时候,是 阅读全文
posted @ 2023-04-18 11:23 芋圆院长 阅读(380) 评论(0) 推荐(0) 编辑