2023 年 4月 18 日随笔档案 - 芋圆院长

2023年4月18日

摘要：奖励奖励强化学习中奖励函数设置不好，agent也得不到好的解。 ##确定奖励函数的注意事项明确任务目标：一定要确保奖励函数和任务目标是一致的，否则可能会出现奖励函数引导 agent 在任务上取得不良的表现。注意：因为算法目标是最大化奖励，所以需要看奖励和目标之间的关系。当我的奖励最大的时候，是阅读全文

posted @ 2023-04-18 11:23 芋圆院长阅读(380) 评论(0) 推荐(0) 编辑

芋圆院长

公告