RDD操作

一、 RDD创建

1、从本地文件系统中加载数据创建RDD

 

 

2. 从HDFS加载数据    

创建RDD

启动hdfs

 

 

上传文件

查看文件

 

 加载

 

 停止hdfs

 

 

3. 通过并行集合(列表)创建RDD    

 输入列表

 

 字符串

 

 生成数组

 

 

二、 RDD操作

 1. 转换操作    

   map(func)

   显式定义函数

   lambda函数

 

 

 

 

2.行动操作    

 foreach(print)

 foreach(lambda a:print(a.upper())

 

 

collect()

posted @ 2022-03-27 16:17  yumus  阅读(19)  评论(0编辑  收藏  举报