通过toDS()方法创建Dataset
object CreateDatasetByToDs { def main(args: Array[String]): Unit = { val conf = new SparkConf().setAppName("demo01").setMaster("local[*]") val session = SparkSession.builder().config(conf).getOrCreate() // 通过集合的toDS()创建Dataset import session.implicits._ val seq: Seq[Teacher] = Array(Teacher("zs", 20), Teacher("ls", 30)) val dataset: Dataset[Teacher] = seq.toDS() dataset.show() // 通过rdd的toDS()创建Dataset import session.implicits._ val rdd: RDD[Teacher] = session.sparkContext.makeRDD(seq) val dataset1 = rdd.toDS() dataset1.show() } } case class Teacher(@BeanProperty var name: String, @BeanProperty age: Int)
本文来自博客园,作者:jsqup,转载请注明原文链接:https://www.cnblogs.com/jsqup/p/16639024.html
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?