摘要: DataSet简介 Dataset的演变流程:SchemaRDD->DataFrame->DataSet DataSet的操作方式和DataFrame几乎没有区别,它是spark1.6出现的 DataSet是Strong type 为什么官方要推出DataSet? 如一个sql: selec a f 阅读全文
posted @ 2019-07-05 17:18 任重而道远的小蜗牛 阅读(250) 评论(0) 推荐(0) 编辑
摘要: DataFrame(重点) 无论是啥语言写的Spark SQL,还是用啥API,最终底层都是专成逻辑执行计划 SparkSession.sql() SparkSession.sql() DataFrame.show(),默认显示20条,字段字符超过一定长度就会被截取 DataFrame.show() 阅读全文
posted @ 2019-07-05 11:17 任重而道远的小蜗牛 阅读(730) 评论(0) 推荐(0) 编辑