随笔分类 - sparklyr
摘要:https://spark.rstudio.com/guides/mlib.html Spark机器学习库 sparklyr提供了Spark分布式机器学习库的绑定。特别是,允许你访问 spark.ml 包提供的机器学习例程。结合 sparklyr的 dplyr 接口,您可以轻松地在 Spark 上创
阅读全文
摘要:使用spaklyr操作数据 dplyr 是一个 R 包,用于在 R 内部和外部处理结构化数据。dplyr 使 R 用户的数据操作变得简单、一致且高性能。 选择、筛选和聚合数据 使用窗口函数(例如,用于采样) 在上执行联接DataFrames 将数据从 Spark 收集到 R 中 dplyr 中的语句
阅读全文