摘要: https://blog.csdn.net/lzm1340458776/article/details/43233639 永久设置严格模式 阅读全文
posted @ 2020-01-09 18:50 骑者赶路 阅读(202) 评论(0) 推荐(0) 编辑
摘要: 一、分区表 1.1 概念 Hive 中的表对应为 HDFS 上的指定目录,在查询数据时候,默认会对全表进行扫描,这样时间和性能的消耗都非常大。 分区为 HDFS 上表目录的子目录,数据按照分区存储在子目录中。如果查询的 where 字句的中包含分区条件,则直接从该分区去查找,而不是扫描整个表目录,合理的分区设计可以极大提高查询速度和性能。 这里说明一下分区表并 Hive 独有的概念,实际上这个概念 阅读全文
posted @ 2020-01-09 18:36 骑者赶路 阅读(655) 评论(0) 推荐(0) 编辑
摘要: Hive常用函数大全一览 https://www.iteblog.com/archives/2258.html Hive 启动 步骤1 start-all.sh 打开hadoop集群 步骤2 jps 查看进程有没有正常启动 步骤3 切到hive的安装目录下,bin/hive 打开hive 步骤4 s 阅读全文
posted @ 2020-01-09 17:25 骑者赶路 阅读(215) 评论(0) 推荐(0) 编辑
摘要: hive建表时,被external修饰的为外部表(external table),未被external修饰的是内部表(managed table)。 二者区别: 内部表数据由Hive自身管理,外部表数据则由HDFS管理; ①、内部表数据存储的位置是hive.metastore.warehouse.d 阅读全文
posted @ 2020-01-09 17:13 骑者赶路 阅读(696) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/bainianminguo/p/11986605.html 阅读全文
posted @ 2020-01-09 16:48 骑者赶路 阅读(122) 评论(0) 推荐(0) 编辑