摘要: “价值不是由一次成功决定的,而是在长期的进取中体现” 上文介绍了描述能力更强的多臂赌博机模型,即通过多台机器的方式对环境变量建模,选择动作策略时考虑时序累积奖赏的影响。虽然多臂赌博机模型中引入了价值的概念,但方法在建模过程中本质上是以策略为优化目标,因此又常被归为基于策略的增强学习方法。 此外,增强 阅读全文
posted @ 2017-07-07 22:32 数据小虾米 阅读(1484) 评论(0) 推荐(0) 编辑

摘要: “模型是一个框架,用来描述分析者感兴趣的研究对象” 上文【增强学习 | 多臂赌博机模型】介绍了基本的多臂赌博机模型,即单步动作会根据反馈直接作出决策,因此多臂赌博机的目标是学习策略函数,以产生最优的执行动作。介绍了两种学习最优策略的方法,一是使用平均累积函数,二是使用神经网络拟合。相比下,神经网络具 阅读全文
posted @ 2017-06-30 22:41 数据小虾米 阅读(947) 评论(0) 推荐(0) 编辑

摘要: 探索的终点是真理 上文介绍了了增强学习的基本框架,一个完整的增强学习框架包括状态、动作、回报、环境等基本概念,其对应的任务问题有三个主要特点: 不同的动作会有不同的回报; 回报是随时间延迟累积的; 行动回报与环境状态是相关的。 对于一些简单的增强学习任务,往往并不需要满足特点2和特点3,将这类问题称 阅读全文
posted @ 2017-06-24 09:11 数据小虾米 阅读(684) 评论(0) 推荐(0) 编辑

摘要: “敢于尝试,才有突破” 2017年5月27日,当今世界排名第一的中国棋手柯洁与AlphaGo 2.0的三局对战落败。该事件标志着最新的人工智能技术在围棋竞技领域超越了人类智能,借此机会,介绍一下AlphaGo背后的秘密——增强学习技术。 增强学习(Reinforcement Learning),也称 阅读全文
posted @ 2017-06-10 18:34 数据小虾米 阅读(462) 评论(0) 推荐(0) 编辑

2017年10月8日

摘要: “Young man, in mathematics you don’t understand things. You just get used to them.” XGBoost(eXtreme Gradient Boosting)算法是Gradient Boosting算法的高效实现版本,因其 阅读全文
posted @ 2017-10-08 21:15 数据小虾米 阅读(513) 评论(0) 推荐(0) 编辑

2017年8月4日

摘要: “控制复杂性是计算机编程的本质” TensorFlow是当今主流的深度学习框架之一,开源社区也在不断推动着它的发展中。网上(包括官方网站)有大量的教程可供参考,而本系列更多尝试从底层和应用角度对TensorFlow框架进行下梳理,首先是原理与概念介绍。 使用TensorFlow框架实现神经网络计算的 阅读全文
posted @ 2017-08-04 22:38 数据小虾米 阅读(306) 评论(0) 推荐(0) 编辑

2017年4月10日

摘要: Most of human and animal learning is unsupervised learning. Yann LeCun在NIPS 2016大会主题报告提出了“预测学习”的概念,可以简单理解为深度无监督学习方法。大会报告主要包括深度学习、预测学习、增强学习、基于能量函数的无监督学 阅读全文
posted @ 2017-04-10 22:58 数据小虾米 阅读(2268) 评论(0) 推荐(1) 编辑

2017年1月21日

摘要: 星星之火,可以燎原 Spark简介 Spark是一个开源的计算框架平台,使用该平台,数据分析程序可自动分发到集群中的不同机器中,以解决大规模数据快速计算的问题,同时它还向上提供一个优雅的编程范式,使得数据分析人员通过编写类似于本机的数据分析程序即可实现集群并行计算。 Spark项目由多个紧密集成的组件组成。核心是Spark Core组件,它实现了Spark的基本功能,包括:任务调... 阅读全文
posted @ 2017-01-21 15:23 数据小虾米 阅读(518) 评论(0) 推荐(0) 编辑

2017年1月11日

摘要: With best wishes for a happy New Year! NIPS(Nerual Information Processing Systems)是人工智能、机器学习领域的顶级学术会议,恰逢深度学习火热,今年于12月7日召开的第30届NIPS 2016会议更是快成为“盛会”了——2500多篇高质量论文投稿,超过5000人的参会规模,Andrew Ng、Ian Goo... 阅读全文
posted @ 2017-01-11 21:11 数据小虾米 阅读(171) 评论(0) 推荐(0) 编辑

导航