会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
tangshine
博客园
首页
新随笔
联系
订阅
管理
2024年8月14日
ES(evolution strategy)进化策略、RL(reinforcement learning)强化学习
摘要: 进化策略 进化策略可被视为这样一个过程:从个体构成的群体中采样并让其中成功的个体引导未来后代的分布。如图中,一个白色箭头是由黑点中的优胜个体引导。 策略作用方式以交叉熵CEM(一种进化算法)为例:算法先随机初始化参数和确定根据参数生成解的规则,根据参数生成N组解并评价每组解的好坏,选出评估结果在前百
阅读全文
posted @ 2024-08-14 20:21 tangshine
阅读(288)
评论(0)
推荐(0)
编辑
公告