摘要: 影响 Hive 效率的几乎从不是数据量过大,而是数据倾斜、数据冗余、job 或 I/O 过多、MapReduce 分配不合理等等。 对 Hive 的调优主要包括三方面: HQL 语句调优 Hive 配置项调优 MapReduce 调优 1. 列裁剪和分区裁剪 所谓列裁剪就是在查询时只读取需要的列,分 阅读全文
posted @ 2021-12-19 22:59 追こするれい的人 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 内置函数介绍 查看 Hive 所有内置函数 show functions; Hive 测试函数的方法 # 通过常量值测试函数的使用 select substr("abcdefg",1,3); Hive 的所有函数手册 https://cwiki.apache.org/confluence/displ 阅读全文
posted @ 2021-12-19 22:26 追こするれい的人 阅读(73) 评论(0) 推荐(0) 编辑