随笔分类 -  Hive

摘要:Hive Hive中文手册 思考: Hive的架构原理 Hive和数据库的比较 几种访问方式的不同 1.1 什么是Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化数据文件映射为一张表,并提供类SQL查询功能。 Hive本质是将HQL转换成MapReduce Hive处理的数据存储 阅读全文
posted @ 2023-03-05 15:26 MrSponge 阅读(162) 评论(0) 推荐(0) 编辑
摘要:拉链表 什么是拉链表? ​ 拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期放入生效的开始日期。(就是在原来表的基础上,加上创建时间/开始时间/操作时间/结束时间,能保证看出记录的变化过程就行了) 如果当前消息至今有效,在生效结束日期中填入一个极大值( 阅读全文
posted @ 2023-02-24 21:03 MrSponge 阅读(162) 评论(0) 推荐(0) 编辑
摘要:hive入门 1. Hive概述 1.1 什么是Hive Hive:由Facebook开源用于解决海量结构化日志的数据统计工具。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 1.2 hive的本质 Hive本质:将HQL转化成MapRed 阅读全文
posted @ 2022-11-13 19:26 MrSponge 阅读(275) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示