1. countByKey
- 定义:countByKey():scala.collection.Map(K,Long)按照key值计算每一个key出现的总次数
- 案例:
| val rdd:RDD[(String,Int)] = sc.makeRDD(Array(("zs",60),("zs",70),("zs",80),("ls",66),("ls",60),("ls",77))) |
| val countByKey: collection.Map[String, Long] = rdd.countByKey() |
| println(countByKey) // Map(zs -> 3, ls -> 3) |
2. saveAsSequenceFile
- 解释:saveAsSequenceFile():rdd有几个分区在HDFS上保存几个文件
- 案例:
| val rdd:RDD[(String,Int)] = sc.makeRDD(Array(("zs",60),("zs",70),("zs",80),("ls",66),("ls",60),("ls",77))) |
| rdd.saveAsTextFile("hdfs://node1:9000/a") |
| rdd.saveAsSequenceFile("hdfs://node1:9000/b") |
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?