Andrew Ng机器学习课程17(1)

Andrew Ng机器学习课程17(1)

声明：引用请注明出处http://blog.csdn.net/lg1259156776/

说明：主要介绍了强化学习与监督学习的设定上的区别，以及强化学习的框架，结合着马尔可夫决策过程来公式化描述强化学习通常的形式。

2015-10-10 艺少

posted @ 2015-10-10 23:29 ZhangPYi 阅读(129) 评论(0) 收藏举报

刷新页面返回顶部