摘要: spark1.4.0的sparkR的思路:用Spark从大数据集中抽取小数据(sparkR的DataFrame),然后到R里分析(DataFrame)。 这两个DataFrame是不同的,前者是分布式的,集群上的DF,R里的那些包都不能用;后者是单机版的DF,包里的函数都能用。 sparkR的开发计 阅读全文
posted @ 2017-03-30 13:43 holy_black_cat 阅读(363) 评论(0) 推荐(0) 编辑