摘要: Spark - RDD(图文讲解) 1. 数据源准备 准备输入文件: $ cat /tmp/in apple bag bag cat cat cat 启动pyspark: $ ./spark/bin/pyspark 使用textFile创建RDD: >>> txt = sc.textFile("fi 阅读全文
posted @ 2020-12-15 10:43 整合侠 阅读(549) 评论(0) 推荐(0) 编辑