会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
冬临
博客园
首页
新随笔
联系
订阅
管理
2019年2月26日
spark groupByKey flatMapGroups初试
摘要: 业务需要: 根据历史库存 预测未来某时间内库存 算法需求: 1. 统计历史3年内的库存量 2. 将库存划分为 平稳流量 和 波动(异常)流量 实际情况: 1. 每天数据量过亿 2. 每天细分维度小于10万 3. 数据中存在 时间断点 4. 尝试按月批次直接处理,过程较慢 回归正题,数据需要 按 各细
阅读全文
posted @ 2019-02-26 17:42 冬临
阅读(3158)
评论(0)
推荐(0)
编辑
公告