hive的基本了解

1、什么是Hive?

Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。叫做HSQL,或者HQL

Hive利用HDFS,也就是分布式文件存储系统来存储数据,利用MapReduce查询数据,简称MR,java程序,

书写的sql语句会转化成MapReduce程序执行。

2、Hive和数据库有什么区别?

Hive 和数据库除了拥有类似的查询语言,再无类似之处。

1)数据存储位置

Hive 存储在 HDFS 。数据库将数据保存在块设备或者本地文件系统中。

2)数据更新

Hive中不建议对数据的改写。而数据库中的数据通常是需要经常进行修改的,

3)执行延迟

Hive 执行延迟较高。数据库的执行延迟较低。当然,这个是有条件的,即数据规模较小,

当数据规模大到超过数据库的处理能力的时候,Hive的并行计算显然能体现出优势。

4)数据规模

Hive支持很大规模的数据计算;数据库可以支持的数据规模较小。

posted @ 2022-05-08 14:30  潜摩羯  阅读(45)  评论(0编辑  收藏  举报