摘要: ###分区表: 分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效率会提高很多。数仓的核心操作也就是写入和查 阅读全文
posted @ 2021-01-22 23:07 Leo-Wong 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 创建数据库 入门写法: hive (default)> create database test; 注:这个数据库的默认在HDFS上的存储路径是/user/hive/warehouse/*.db 位置配置:hive.metastore.warehouse.dir(例如,/user/hive/ware 阅读全文
posted @ 2021-01-22 23:07 Leo-Wong 阅读(1311) 评论(0) 推荐(0) 编辑