摘要:
一、决策树(类型、节点特征选择的算法原理、优缺点、随机森林算法产生的背景) 1、分类树和回归树 由目标变量是离散的还是连续的来决定的;目标变量是离散的,选择分类树;反之(目标变量是连续的,但自变量可以是分类的或数值的),选择回归树; 树的类型不同,节点分裂的算法和预测的算法也不一样; 分类树会使用基 阅读全文
摘要:
分布式 map-reduce: 一个业务分拆多个子业务,部署在不同的服务器上。 一个业务分拆多个子业务,部署在不同的服务器上。 形象地说,就是不同的机器,虽然做的事情不一样,但是互相独立,也不需要在意先后顺序关系,那么在map阶段,它们就可以并行执行(task);在reduce阶段,把各个结果以某种 阅读全文