摘要: 年前有些放纵了,一直没有完成该篇的节奏感。推延至今 大数据量面前单机显然是不合适的,所以尝试将前述逻辑 并发化 考虑 以适应 分布式处理。 回溯数据清洗流程, 1.流量数据区间圈定, 2.流量数据按要求筛选聚合 3.各汇总表按唯一标志联合 在初步猜想中,需要一张包含所有唯一标志的主表,这也是减少匹配 阅读全文
posted @ 2019-02-15 00:11 冬临 阅读(444) 评论(0) 推荐(0) 编辑