摘要: 在决策树算法原理(上)这篇里,我们讲到了决策树里ID3算法,和ID3算法的改进版C4.5算法。对于C4.5算法,我们也提到了它的不足,比如模型是用较为复杂的熵来度量,使用了相对较为复杂的多叉树,只能处理分类不能处理回归等。对于这些问题, CART算法大部分做了改进。CART算法也就是我们下面的重点了 阅读全文
posted @ 2018-03-04 13:38 上帝不玩骰子 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。本文就对决策树算法原理做一个总结,上篇对ID3, C4.5的算法思想做了总结,下篇重点对CART算法做一个详细的介绍。选择CART做重点介绍的原因是scikit-learn 阅读全文
posted @ 2018-03-04 13:37 上帝不玩骰子 阅读(280) 评论(0) 推荐(0) 编辑
摘要: 在MCMC(一)蒙特卡罗方法中,我们讲到了如何用蒙特卡罗方法来随机模拟求解一些复杂的连续积分或者离散求和的方法,但是这个方法需要得到对应的概率分布的样本集,而想得到这样的样本集很困难。因此我们需要本篇讲到的马尔科夫链来帮忙。 1. 马尔科夫链概述 马尔科夫链定义本身比较简单,它假设某一时刻状态转移的 阅读全文
posted @ 2018-03-04 13:35 上帝不玩骰子 阅读(719) 评论(0) 推荐(0) 编辑
摘要: 作为一种随机采样方法,马尔科夫链蒙特卡罗(Markov Chain Monte Carlo,以下简称MCMC)在机器学习,深度学习以及自然语言处理等领域都有广泛的应用,是很多复杂算法求解的基础。比如我们前面讲到的分解机(Factorization Machines)推荐算法,还有前面讲到的受限玻尔兹 阅读全文
posted @ 2018-03-04 13:32 上帝不玩骰子 阅读(396) 评论(0) 推荐(0) 编辑