05 2021 档案

摘要:Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。 但是如果我们只局限于会使用Hive,而不考虑性能问题,就难搭建出一个完美的数仓,所以Hive性能调优是我们大数据从业者必须掌握的技能。本文将给大家讲解Hive性能调优的一些方法及技巧。 本 阅读全文
posted @ 2021-05-14 11:40 五分钟学大数据 阅读(667) 评论(0) 推荐(0) 编辑
摘要:1. hive内部表和外部表的区别 未被external修饰的是内部表,被external修饰的为外部表。 区别: 内部表数据由Hive自身管理,外部表数据由HDFS管理; 内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse 阅读全文
posted @ 2021-05-13 18:37 五分钟学大数据 阅读(2144) 评论(0) 推荐(2) 编辑
摘要:在Hive中会有很多数据是用Json格式来存储的,如开发人员对APP上的页面进行埋点时,会将多个字段存放在一个json数组中,因此数据平台调用数据时,要对埋点数据进行解析。接下来就聊聊Hive中是如何解析json数据的。 本文首发于公众号【五分钟学大数据】 Hive自带的json解析函数 1. ge 阅读全文
posted @ 2021-05-12 10:54 五分钟学大数据 阅读(22373) 评论(0) 推荐(3) 编辑

点击右上角即可分享
微信分享提示