会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Lee_ing
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
下一页
2023年5月17日
动态规划算法基础及leetcode例题
摘要: 动态规划算法学习笔记
阅读全文
posted @ 2023-05-17 21:35 lee_ing
阅读(24)
评论(0)
推荐(0)
编辑
Jan 2023-Prioritizing Samples in Reinforcement Learning with Reducible Loss
摘要: 优先级经验回放改进---改进优先级更新公式【专注于具有更高的可减少TD误差的样本,而不是根据TD误差进行优先级排序】
阅读全文
posted @ 2023-05-17 16:32 lee_ing
阅读(159)
评论(3)
推荐(1)
编辑
April 2022-Explanation-Aware Experience Replay in Rule-Dense Environments
摘要: 将回放缓冲区(或内存)划分为多个簇,每个簇代表与作为示例的经验集合相关的不同解释,从而修改了传统的经验回放结构。
阅读全文
posted @ 2023-05-17 11:37 lee_ing
阅读(19)
评论(0)
推荐(0)
编辑
2023年5月16日
Sep 2022-Actor Prioritized Experience Replay
摘要: 针对AC算法不能有效的使用PER,证明actor不能使用PER更好的训练,提出改进,使用一个全新的优先级结构tree,并与critic共享部分训练集,结合LAP的结论,使得AC+PER效果更优
阅读全文
posted @ 2023-05-16 12:07 lee_ing
阅读(55)
评论(0)
推荐(0)
编辑
2023年5月10日
Apr 2023-Event Tables for Efficient Experience Replay
摘要: 事件表分层抽样(SSET),将ER缓冲区划分为事件表,每个事件表捕获最优行为的重要子序列。
阅读全文
posted @ 2023-05-10 11:43 lee_ing
阅读(16)
评论(0)
推荐(0)
编辑
2023年4月20日
贪心算法基础及leetcode例题
摘要: 代码随想录学习笔记
阅读全文
posted @ 2023-04-20 11:15 lee_ing
阅读(48)
评论(0)
推荐(0)
编辑
2023年4月19日
02计算机网络---物理层
摘要: 计算机网络学习笔记
阅读全文
posted @ 2023-04-19 12:11 lee_ing
阅读(73)
评论(0)
推荐(0)
编辑
01计算机网络概论
摘要: 学习笔记---计算机网络 第二版 第2版 杨庚 胡素君 叶晓国 高等教育出版社
阅读全文
posted @ 2023-04-19 10:58 lee_ing
阅读(73)
评论(0)
推荐(0)
编辑
2023年4月18日
05单件模式
摘要: head first设计模式学习笔记
阅读全文
posted @ 2023-04-18 18:07 lee_ing
阅读(43)
评论(0)
推荐(0)
编辑
2023年4月17日
04工厂模式
摘要: head first设计模式学习笔记
阅读全文
posted @ 2023-04-17 18:01 lee_ing
阅读(4)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
下一页
公告