04 2022 档案

摘要:看论文的时候出现了投影不动点迭代的概念,在网上搜索了一圈也没有看到太多相关的东西。 只看到了很多凸优化方面的不动点迭代内容,先粘个参考链接,学懂了前来补充~ 投影的概念和不动点迭代的结合 不动点迭代 不动点迭代的概念在第1个参考链接里描述的比较明确,梯度等于0 x与算子之间的关系,画图来看就是函数曲 阅读全文
posted @ 2022-04-18 11:03 芋圆院长 阅读(512) 评论(0) 推荐(0) 编辑
摘要:凸共轭:凸共轭是勒让德变换的一种推广;凸共轭也被称作Legendre–Fenchel变换,或者Fenchel变换(以Adrien-MarieLegendre和WernerFenchel命名)。 勒让德变换:一个在数学和物理中常见的技巧,得名于阿德里安-马里·勒壤得(Arien-Marie Legen 阅读全文
posted @ 2022-04-14 21:47 芋圆院长 阅读(452) 评论(0) 推荐(0) 编辑
摘要:近来发现自己概念有些混淆,写一点自己对从Sutton书上看到的这些方法之间联系的理解和想法。 【如有不恰当的地方,欢迎指正!】 前言 强化学习的初始驱动就是通过和环境互动得到的奖励来评估经历过的状态或状态下选择的动作的好坏,从而选择出合适的策略进行控制。 所以最好的办法就是之前DP提到的利用贝尔曼方 阅读全文
posted @ 2022-04-12 21:11 芋圆院长 阅读(125) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示