2021 年 12月 23 日随笔档案 - xxxuanei

2021年12月23日

什么是Experience Replay和Seperate Target Networks

摘要：什么是Experience Replay, Seperate Target Network 最近看到的一篇论文中提到的面对RL network不稳定甚至发散两个方法。 non-linear function approximator is unstable or even to diverge. I 阅读全文

posted @ 2021-12-23 15:31 xxxuanei 阅读(110) 评论(0) 推荐(0) 编辑

XXXUANEI

愿全世界无产者和被压迫民族联合起来

公告