2020年1月14日

Adaboost算法推导

摘要: Adaboost(Adaptive boosting)是boosting(提升)家族的重要算法。boosting家族算法的核心是串行训练学习器,可以理解为"站在巨人的肩膀",后一个学习器的学习是基于前一个学习器的学习基础之上的,对应的是bagging学习器,学习器之间没有依赖关系。 把握住Adabo 阅读全文

posted @ 2020-01-14 19:37 张叫兽的技术研究院 阅读(1127) 评论(0) 推荐(0) 编辑

Spark优化 – 基础篇

摘要: 大数据调优总体方向:CPU,内存以及IO(Disk,Network)三个方面来进行。 对于多次使用的数据(RDD/DataFrame),通过cache()或者persis()来进行缓存,避免每一次都从数据源获取(减少磁盘IO); 系统资源优化 如下参数可以进行调优(可以参见附录中介绍的spark和y 阅读全文

posted @ 2020-01-14 18:30 张叫兽的技术研究院 阅读(527) 评论(0) 推荐(0) 编辑

导航