2021 年 12月 23 日随笔档案 - Shydow

2021年12月23日

摘要：正常的SPARK SQL执行会先经过SQL Parser解析SQL，然后经过Catalyst优化器处理，最后到spark执行，其中包括以下几个重要的部分： SQL Parse：sql解析器将sql解析为抽象语法树，即Unresolved Logical Plan Analysis：利用Catalog 阅读全文

posted @ 2021-12-23 19:36 Shydow 阅读(198) 评论(0) 推荐(0) 编辑

SPARK中使用到的工具

摘要： 1）sc.textFile读取小文件时，调用的时hadoopFile，使用的是textInputFormat，除了使用sc.wholeTextFiles还可以自定义CombineFileInputFormat // sc.textFile调用的是 sc.hadoopFile，但是InputForma 阅读全文

posted @ 2021-12-23 10:19 Shydow 阅读(187) 评论(0) 推荐(0) 编辑

Shydow

公告