4.RDD操作
一、 RDD创建
- 1.从本地文件系统中加载数据创建RDD
- 从HDFS加载数据创建RDD
启动hdfs
上传文件
查看文件
加载
停止hdfs - 通过并行集合(列表)创建RDD
二、 RDD操作
转换操作
- filter(func)
显式定义函数
lambda函数 - map(func)
显式定义函数
lambda函数
a.字符串分词
b.数字加100
3.flatMap(func)
a.分词
b.单词映射成键值对
4.reduceByKey()
a.统计词频,累加
5. groupByKey()
c..分组之后做累加map
6.sortByKey()
7.sortBy()
8.RDD写入文本文件
a/写入本地文件系统,并查看结
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· C#/.NET/.NET Core技术前沿周刊 | 第 29 期(2025年3.1-3.9)
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异