摘要: 动态规划算法学习笔记 阅读全文
posted @ 2023-05-17 21:35 lee_ing 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 优先级经验回放改进---改进优先级更新公式【专注于具有更高的可减少TD误差的样本,而不是根据TD误差进行优先级排序】 阅读全文
posted @ 2023-05-17 16:32 lee_ing 阅读(159) 评论(3) 推荐(1) 编辑
摘要: 将回放缓冲区(或内存)划分为多个簇,每个簇代表与作为示例的经验集合相关的不同解释,从而修改了传统的经验回放结构。 阅读全文
posted @ 2023-05-17 11:37 lee_ing 阅读(19) 评论(0) 推荐(0) 编辑
摘要: 针对AC算法不能有效的使用PER,证明actor不能使用PER更好的训练,提出改进,使用一个全新的优先级结构tree,并与critic共享部分训练集,结合LAP的结论,使得AC+PER效果更优 阅读全文
posted @ 2023-05-16 12:07 lee_ing 阅读(55) 评论(0) 推荐(0) 编辑
摘要: 事件表分层抽样(SSET),将ER缓冲区划分为事件表,每个事件表捕获最优行为的重要子序列。 阅读全文
posted @ 2023-05-10 11:43 lee_ing 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 代码随想录学习笔记 阅读全文
posted @ 2023-04-20 11:15 lee_ing 阅读(48) 评论(0) 推荐(0) 编辑
摘要: 计算机网络学习笔记 阅读全文
posted @ 2023-04-19 12:11 lee_ing 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 学习笔记---计算机网络 第二版 第2版 杨庚 胡素君 叶晓国 高等教育出版社 阅读全文
posted @ 2023-04-19 10:58 lee_ing 阅读(73) 评论(0) 推荐(0) 编辑
摘要: head first设计模式学习笔记 阅读全文
posted @ 2023-04-18 18:07 lee_ing 阅读(43) 评论(0) 推荐(0) 编辑
摘要: head first设计模式学习笔记 阅读全文
posted @ 2023-04-17 18:01 lee_ing 阅读(4) 评论(0) 推荐(0) 编辑