DFonRDD
package com.shujia.spark.sql import org.apache.spark.SparkContext import org.apache.spark.rdd.RDD import org.apache.spark.sql.{DataFrame, Row, SparkSession} object Demo4DFonRDD { def main(args: Array[String]): Unit = { val spark: SparkSession = SparkSession .builder() .appName("source") .master("local") .config("spark.sql.shuffle.partitions", "1") .getOrCreate() //导入隐式转换 import spark.implicits._ //导入spark 所有的函数 import org.apache.spark.sql.functions._ /** * * 1、可以通过SparkSession 获取SparkContext */ val sc: SparkContext = spark.sparkContext val studentRDD: RDD[String] = sc.textFile("data/students.txt") /** * rdd 转换成DF * */ val studentTuple: RDD[(String, String, Int, String, String)] = studentRDD.map(line => { val split: Array[String] = line.split(",") (split(0), split(1), split(2).toInt, split(3), split(4)) }) //指定列名 val studentDF: DataFrame = studentRDD.toDF("id","name","age","gender","clazz") studentDF.printSchema() studentDF.show() val studentBean: RDD[Student] = studentRDD.map(line => { val split: Array[String] = line.split(",") Student(split(0), split(1), split(2).toInt, split(3), split(4)) }) //如果rdd的类型是一个自定义的类,不需要指定类型 val studentBeanDF: DataFrame = studentBean.toDF() studentBeanDF.printSchema() studentBeanDF.show() /** * * DF 转换成RDD */ val rdd: RDD[Row] = studentBeanDF.rdd //通过列名和类型取字段 rdd.map(row => { val id: String = row.getAs[String]("id") val name: String = row.getAs[String]("name") val age: Int = row.getAs[Int]("age") val gender: String = row.getAs[String]("gender") val clazz: String = row.getAs[String]("clazz") (id, name, age, gender, clazz) }).foreach(println) } case class Student(id: String, name: String, age: Int, gender: String, clazz: String) }
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· DeepSeek在M芯片Mac上本地化部署
· 葡萄城 AI 搜索升级:DeepSeek 加持,客户体验更智能