java/Java Pyton 大数据 Hadoop Spark

摘要: Spark SQL模块,主要就是处理跟SQL解析相关的一些内容,说得更通俗点就是怎么把一个SQL语句解析成Dataframe或者说RDD的任务。以Spark 2.4.3为例,Spark SQL这个大模块分为三个子模块,如下图所示 其中Catalyst可以说是Spark内部专门用来解析SQL的一个框架 阅读全文
posted @ 2020-04-21 20:49 zzzzMing 阅读(8782) 评论(0) 推荐(2) 编辑