会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
soyosuyang
博客园
首页
新随笔
联系
管理
订阅
2018年3月24日
Spark 大数据文本统计
摘要: 此程序功能: 1.完成对10.4G.csv文件各个元素频率的统计 2.获得最大的统计个数 3.对获取到的统计个数进行降序排列 4.对各个元素出现次数频率的统计 数据内容: Spark 保存的文件是这样的: 这里可以用一个脚本将这么多的文件进行合并: 结果太多只写一个: 获取统计的最大数2948874
阅读全文
posted @ 2018-03-24 20:20 soyosuyang
阅读(1449)
评论(0)
推荐(0)
编辑
公告