摘要: 日前,Rstudio公司发布了sparklyr包。该包具有以下几个功能: 实现R与Spark的连接—sparklyr包提供了一个完整的dplyr后端 筛选并聚合Spark数据集,接着在R中实现分析与可视化 利用Spark的MLlib机器学习库在R中实现分布式机器学习算法 可以创建一个扩展,用于调用S 阅读全文
posted @ 2016-06-30 16:38 payton数据之旅 阅读(5798) 评论(0) 推荐(0) 编辑