会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
hgz_dm
博客园
首页
新随笔
联系
订阅
管理
2019年9月4日
在spark上构造随机森林模型过程的一点理解
摘要: 这篇文章仅仅是为了帮助自己理解在分布式环境下是如何进行随机森林模型构建的,文章中记录的内容可能不太准确,仅仅是大致上的一个理解。 1.特征切分点统计 不管是连续取值型特征还是离散取值型特征,分裂树结点时都需要寻找最优特征的最优切分点。离散型特征还好一点,对连续型特征,其取值情况多,若是遍历所有数据样
阅读全文
posted @ 2019-09-04 20:29 hgz_dm
阅读(762)
评论(0)
推荐(0)
编辑
公告