第五章_Spark核心编程_Rdd_行动算子_save oprator
1.定义
/* * 1.定义 * def saveAsTextFile(path: String): Unit * def saveAsObjectFile(path: String): Unit * def saveAsSequenceFile( * path: String, * codec: Option[Class[_ <: CompressionCodec]] = None): Unit * 2.功能 * 将数据保存到不同格式的文件中 * 3.note * saveAsTextFile : 保存文本文件 * saveAsObjectFile : 保存对象序列化字节文件 * saveAsSequenceFile : 保存SequenceFile文件 * */
2.示例
object saveTest extends App { val sparkconf: SparkConf = new SparkConf().setMaster("local").setAppName("distinctTest") val sc: SparkContext = new SparkContext(sparkconf) private val rdd = sc.makeRDD(List((1,"x"),(1,"x"),(2,"x"),(2,"x"),(2,"x")), 2) rdd.saveAsTextFile("Spark_319/src/output/01") rdd.saveAsObjectFile("Spark_319/src/output/02") rdd.saveAsSequenceFile("Spark_319/src/output/03") sc.stop() }
3.指定压缩方式
object RddActionOperator_saveAsTextFile extends App { private val sc: SparkContext = CommonUtils.getSparkContext("countByKey Action operator") private val rdd: RDD[(String, Int)] = sc.parallelize(List( ("s", 2), ("s", 1), ("p", 1), ("p", 1), ("p", 1), ), 1) //将rdd内容作为字符串,保存到指定目录,并指定压缩方式 //rdd.saveAsTextFile("src/main/data/output/listrdd1", new GzipCodec().getClass) rdd.saveAsTextFile("src/main/data/output/listrdd1", classOf[GzipCodec]) //part-00000.gz sc.stop() //while (true) {} }
分类:
SparkCore
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 地球OL攻略 —— 某应届生求职总结
· 提示词工程——AI应用必不可少的技术
· 字符编码:从基础到乱码解决
· SpringCloud带你走进微服务的世界