会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Blueherb
In solitude, where we are least alone
帅气的小土豆
博客园
首页
新随笔
联系
订阅
管理
2021年2月10日
寒假自学2.10
摘要: Q-Learning算法 Q-learning要解决的是这样的问题:一个能感知环境的自治agent,怎样通过学习选择能达到其目标的最优动作。 强化学习目的是构造一个控制策略,使得Agent行为性能达到最大。Agent从复杂的环境中感知信息,对信息进行处理。Agent通过学习改进自身的性能并选择行为,
阅读全文
posted @ 2021-02-10 19:14 帅气的小土豆
阅读(26)
评论(0)
推荐(0)
编辑
公告