会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
番茄炒蛋花花花汤
博客园
首页
新随笔
联系
订阅
管理
公告
2022年7月13日
组会记录——强化学习
摘要: ※ 对数似然函数与一般似然函数的区别? 1、方便求导; 2、减少计算量; 3、不影响单调性。 ※ 离散变量如何求导?指示函数如何求导? ※ 强化学习需要状态都是离散量吗? 状态空间S和动作空间A都必须使有限的?现在强化学习已经有处理连续变量的technique? 首先是由于功率控制是MDP问题,所以
阅读全文
posted @ 2022-07-13 22:59 番茄炒蛋花花花汤
阅读(15)
评论(0)
推荐(0)
编辑