摘要: 背景 ​ 我们的数据挖掘平台对数据统计有比较迫切的需求,而Spark本身对数据统计已经做了一些工作,希望梳理一下Spark已经支持的数据统计功能,后期再进行扩展。 准备数据 在参考文献6中下载 "鸢尾花数据" ,此处格式为iris.data格式, 先将data后缀改为csv后缀(不影响使用,只是为了 阅读全文
posted @ 2020-01-02 13:49 starqiu 阅读(4336) 评论(0) 推荐(0) 编辑