摘要: 案例一:词频统计 要求:统计Harry Potter.txt文件中出现最多单词前十位 内容样例: def WordCount(): Unit ={ val conf=new SparkConf().setMaster("local[6]").setAppName("wordCount") val s 阅读全文
posted @ 2021-01-11 22:09 MoooJL 阅读(360) 评论(0) 推荐(0) 编辑
摘要: SparkSQL 发展过程 解决的问题 Spark SQL 使用 Hive 解析 SQL 生成 AST 语法树, 将其后的逻辑计划生成, 优化, 物理计划都自己完成, 而不依赖 Hive 执行计划和优化交给优化器 Catalyst 内建了一套简单的 SQL 解析器, 可以不使用 HQL, 此外, 还 阅读全文
posted @ 2021-01-11 19:50 MoooJL 阅读(89) 评论(0) 推荐(0) 编辑