会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
starqiu
博客园
首页
新随笔
联系
订阅
管理
2020年1月2日
使用SparkSql进行表的分析与统计
摘要: 背景 我们的数据挖掘平台对数据统计有比较迫切的需求,而Spark本身对数据统计已经做了一些工作,希望梳理一下Spark已经支持的数据统计功能,后期再进行扩展。 准备数据 在参考文献6中下载 "鸢尾花数据" ,此处格式为iris.data格式, 先将data后缀改为csv后缀(不影响使用,只是为了
阅读全文
posted @ 2020-01-02 13:49 starqiu
阅读(4336)
评论(0)
推荐(0)
编辑
公告