Apache Spark 2.2.0 中文文档 - SparkR (R on Spark) | ApacheCN
摘要:
SparkR 是一个 R package, 它提供了一个轻量级的前端以从 R 中使用 Apache Spark. 在 Spark 2.2.0 中, SparkR 提供了一个分布式的 data frame, 它实现了像 selection, filtering, aggregation etc 一系列所支持的操作.(dplyr 与 R data frames 相似) ), 除了可用于海量数据上之外. SparkR 还支持使用 MLlib 来进行分布式的 machine learning(机器学习). 阅读全文
posted @ 2017-09-26 19:29 nm-xy 阅读(1613) 评论(0) 推荐(0) 编辑