2019 年 4月 8 日随笔档案 - Shiyu_Huang

2019年4月8日

摘要： 1.Le, Tuan Anh, et al. "Auto-encoding sequential monte carlo." arXiv preprint arXiv:1705.10306 (2017). 阅读全文

posted @ 2019-04-08 15:47 Shiyu_Huang 阅读(325) 评论(0) 推荐(0) 编辑

摘要： 1. http://rll.berkeley.edu/adversarial/ Adversarial Attacks on Neural Network Policies 就是对test时候的policy进行构造对抗样本，方法还是用的分类对抗样本的方法，对于DQN，把Q value做个softma 阅读全文

posted @ 2019-04-08 14:39 Shiyu_Huang 阅读(262) 评论(0) 推荐(0) 编辑

黄世宇@智谱AI，OpenRL Lab负责人，强化学习，LLM，通用人工智能[OpenRL][知乎][GitHub][Linkedin]如果你对人工智能前沿感兴趣，欢迎联系并加入我们！

黄世宇@智谱AI，OpenRL Lab负责人，强化学习，LLM，通用人工智能
[OpenRL][知乎][GitHub][Linkedin]
如果你对人工智能前沿感兴趣，欢迎联系并加入我们！