摘要: SparkR SparkR是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为Spark的job运行在集群上,极大得扩展了R的数据处理能力。 SparkR的几个特性: l 提供了Spark中弹性分布式数据集(RDD)的API,用户可以在集群上通过R shell交互性的运行Spark 阅读全文
posted @ 2022-04-18 21:09 软工新人 阅读(12) 评论(0) 推荐(0) 编辑