会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
bourneli(李伯韬)的技术博客
博客搬家了,新的日志会在
一数一世界
更新!
博客园
首页
新随笔
联系
订阅
管理
2015年5月3日
Spark随机森林实现学习
摘要: 前言 最近阅读了spark mllib(版本:spark 1.3)中Random Forest的实现,发现在分布式的数据结构上实现迭代算法时,有些地方与单机环境不一样。单机上一些直观的操作(递归),在分布式数据上,必须进行优化,否则I/O(网络,磁盘)会消耗大量时间。本文整理spark随机森林实现中的相关技巧,方便后面回顾。 随机森林算法概要 随机森林算法的详细实现和细节,可以参考论文Brei...
阅读全文
posted @ 2015-05-03 14:23 bourneli
阅读(9019)
评论(0)
推荐(0)
编辑
公告