摘要: 一、决策树(类型、节点特征选择的算法原理、优缺点、随机森林算法产生的背景) 1、分类树和回归树 由目标变量是离散的还是连续的来决定的;目标变量是离散的,选择分类树;反之(目标变量是连续的,但自变量可以是分类的或数值的),选择回归树; 树的类型不同,节点分裂的算法和预测的算法也不一样; 分类树会使用基 阅读全文
posted @ 2018-04-12 09:29 Iris ^ 阅读(16057) 评论(0) 推荐(2) 编辑
摘要: 分布式 map-reduce: 一个业务分拆多个子业务,部署在不同的服务器上。 一个业务分拆多个子业务,部署在不同的服务器上。 形象地说,就是不同的机器,虽然做的事情不一样,但是互相独立,也不需要在意先后顺序关系,那么在map阶段,它们就可以并行执行(task);在reduce阶段,把各个结果以某种 阅读全文
posted @ 2018-04-12 09:03 Iris ^ 阅读(869) 评论(0) 推荐(0) 编辑