摘要: 《云计算下SPRINT并行算法研究》张春艳《软件》201第31卷 第11期论文的主要内容是:在云计算的Hadoop集群框架和数据挖掘技术中的 SPRINT 分类算法的基础上。详细描述SPRINT并行算法在 Hadoop中的MapReduce编程模型上的执行流程。并利用分折出的决策树模型 对输入数据进行分类。名词:map-reduce,map就是将一个任务分解成为多个任务。reduce就是将分解后多任务处理的结果汇总起来。得出最后的分析结果。主要的数学公式:1、分裂指数是属性分裂规则优劣程度的一个度量,Gini指数方法能够有效地搜索最佳分裂点。提供最小Gini指数的分割具有最大信息增益。被选为最 阅读全文
posted @ 2011-11-05 16:15 浙大软院论文交流 阅读(378) 评论(0) 推荐(0) 编辑