会员
周边
捐助
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
demsg
新随笔
管理
2018年11月15日
如何在hadoop上做等频离散化
摘要: 抛砖引玉,先根据特征值group by,统计每个特征值出现次数,然后reduce到一个文件,根据一个文件来统计吧,毕竟,你知道多个桶,那么每个桶多少个样本就是确定了,数数,数到一个桶样本的时候停止,就是一个阈值呗
阅读全文
posted @ 2018-11-15 19:36 dmesg
阅读(367)
评论(0)
推荐(0)
编辑
公告