会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
博客园
首页
归档
相册
陈煜弘
博客园
首页
新随笔
联系
订阅
管理
2017年4月14日
Lecture 4: Model-Free Prediction
摘要: 1.Monte-Carlo Reinforcement Learning a)MC方法直接从经历中的episodes中学习 b)MC方法是无模型的, c)从完整的episodes中学习:而不是走一步学学一步(bootstrapping) d)注意:只能将MC方法应用到episodic MDPs,而且
阅读全文
posted @ 2017-04-14 21:37 陈煜弘
阅读(273)
评论(0)
推荐(0)
编辑
Software Testing -- LAB03-soot的使用
摘要: 1.生成dot 2.根据生成的dot生成png图 3.结果: 4.使用代码
阅读全文
posted @ 2017-04-14 12:18 陈煜弘
阅读(218)
评论(0)
推荐(0)
编辑
公告