再多学一点吧

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

随笔分类 -  HIVE

Hive数仓
摘要:分层设计 ODS(Operational Data Store):数据运营层 “面向主题的”数据运营层,也叫ODS层,是最接近数据源中数据的一层,数据源中的数据,经过抽取、洗净、传输,也就说传说中的 ETL 之后,装入本层。本层的数据,总体上大多是按照源头业务系统的分类方式而分类的。 一般来讲,为了 阅读全文

posted @ 2021-10-08 22:56 糟糟张 阅读(152) 评论(0) 推荐(0) 编辑

Hive调优
摘要:Hive建表优化 1,分区,分桶 一般是按照业务日期进行分区 每天的数据放在一个分区里 2,一般使用外部表,避免数据误删 3,选择适当的文件储存格式及压缩格式 4,命名要规范 5,数据分层,表分离,但是也不要分的太散 Hive查询优化 分区裁剪 where过滤, 先过滤,后join 分区分桶, 合并 阅读全文

posted @ 2021-10-08 21:32 糟糟张 阅读(111) 评论(0) 推荐(0) 编辑

Hive大全
摘要:Hive是基于Hadoop的一个数据仓库,可将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。其实,Hive的本质是将HiveSQL语句转化成MapReduce任务执行。 count(*)、count(1) 、count('字段名') 区别: count(*)包括了所有的列,相当于行数, 阅读全文

posted @ 2021-09-26 20:46 糟糟张 阅读(385) 评论(0) 推荐(0) 编辑

Hive安装
摘要:1.解压hive文件 tar -zxvf /usr/local/moudle/apache-hive-1.2.1-bin.tar.gz -C /usr/local/soft/ 2.修改目录名称: mv apache-hive-1.2.1-bin hive-1.2.1 3.进入hive-1.2.1下的 阅读全文

posted @ 2021-09-25 15:26 糟糟张 阅读(48) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示