hive和关系型数据库

1）hive和关系型数据库存储文件的系统不同。 hive使用hdfs（hadoop的分布式文件系统），关系型数据库则是服务器本地的文件系统；

2）hive使用的计算模型是mapreduce，而关系型数据库则是自己设计的计算模型。

3）hive是为海量数据做数据挖掘设计的，实时性差；而关系型数据库是为实时查询的业务进行设计的。

4）hive很容易扩展自己的存储能力和计算能力，这个是继承hadoop的，而关系型数据库在这方面相对较差。而数据库由于 acid 语义的严格限制，扩展行非常有限。

5）hive中不支持对某个具体行的操作，对数据的操作只支持覆盖原数据和追加数据；hive也不支持事务和索引。 ---------已经都支持了吧

6）hive在加载数据时候和关系数据库不同。

　　　　hive:检查数据格式的操作是在查询操作时候执行，这种模式叫“读时模式"

　　　　关系数据库:“写时模式”，数据加载时候对数据模式进行检查校验的操作。

　　　　当我们的数据是非结构化，存储模式也是未知时候，关系数据操作这种场景就麻烦多了，这时候hive就会发挥它的优势。

7）执行延迟。

　　　　在利用 mapreduce 执行 hive 查询时，也会有较高的延迟。相对的，数据库的执行延迟较低。

posted @ 2017-10-27 16:45 hongma 阅读(3955) 评论(0) 编辑收藏举报

刷新页面返回顶部

hongma