hive的总结
hive的一些总结
什么是hive:
可以将结构化的数据文件映射为一张数据库表,并提供类 SQL 查询功能。
本质:将SQL转换为 MapReduce 程序。
主要用途:用来做离线数据分析,比直接用MapReduce 开发效率更高。
为什么使用Hive:
直接使用 Hadoop MapReduce 处理数据所面临的问题:
人员学习成本太高
MapReduce 实现复杂查询逻辑开发难度太大
使用Hive:
操作接口采用类 SQL 语法,提供快速开发的能力
避免了去写 MapReduce ,减少开发人员的学习成本
功能扩展很方便
Hive 架构图
分享是进步的一大步