摘要: 一、RDD创建 1.从本地文件系统中加载数据创建RDD 2.从HDFS加载数据创建RDD 启动hdfs 上传文件 查看文件 加载 停止hdfs 3.通过并行集合(列表)创建RDD 输入列表 字符串 numpy生成数组 二、RDD操作 1、转换操作 filter(func) 显式定义函数 lambda 阅读全文
posted @ 2022-03-16 15:30 粉柠檬 阅读(80) 评论(0) 推荐(0) 编辑