LZ名約山炮

博客园 首页 新随笔 联系 订阅 管理

2021年6月28日 #

摘要: 原因: 默认情况下 hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat(切片),此设置的功能是将输入目录的小文件进行切片合并,但是误将lzo.index文件也作为数据,故导致读数不准。 解决: 不使用Combin 阅读全文
posted @ 2021-06-28 18:36 LZ名約山炮 阅读(111) 评论(0) 推荐(0) 编辑

摘要: 第1章 Superset入门 1.1 Superset概述 Apache Superset是一个开源的、现代的、轻量级BI分析工具,能够对接多种数据源、拥有丰富的图标展示形式、支持自定义仪表盘,且拥有友好的用户界面,十分易用。 1.2 Superset应用场景 由于Superset能够对接常用的大数 阅读全文
posted @ 2021-06-28 15:59 LZ名約山炮 阅读(182) 评论(0) 推荐(0) 编辑

摘要: 第10章 全流程调度 10.1 Azkaban部署 详情请看博客:https://www.cnblogs.com/LzMingYueShanPao/p/14911782.html 10.2 创建MySQL数据库和表 1)创建 gmall_report 数据库(也可以使用SQL语句创建) #使用Sql 阅读全文
posted @ 2021-06-28 02:16 LZ名約山炮 阅读(220) 评论(0) 推荐(0) 编辑