会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
土豆面包
博客园
首页
新随笔
联系
订阅
管理
2021年1月23日
spark统计每个省份广告点击量top3
摘要: 一、原始数据 agent.log:时间戳,省份,城市,用户,广告,中间字段使用空格分隔。 数据量:5000条 119kb 二、任务目标 统计出每一个省份每个广告被点击数量排行的 Top3 三、思路整理 1.获取原始数据:时间戳、省份、城市、用户、广告编号 2.将原始数据转换为((省份,广告),1)的
阅读全文
posted @ 2021-01-23 23:25 土豆面包
阅读(1298)
评论(0)
推荐(0)
编辑
公告