Hive

简介

Hive由FaceBook开源用于解决海量结构化日志的数据统计技术

Hive是基与Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行

什么是Hive？

Hive支持SQL

为什么使用Hive

降低学习MapReduce的难度，使DBA，运维人员可以通过SQL来实现

优点

缺点

Hive的工作原理

Hive与数据库的对比

特性	数据库	Hive
查询语言	SQL	HQL
存储位置	块设备或本地文件系统	HDFS
数据更新	Update	不建议修改，建议追加
索引	建立索引，提高效率降低延迟	没有索引，暴力搜索。使用MapReduce进行并行访问
执行引擎	InnoDB等引擎	MapReduce
延迟	延迟较低	延迟较高
数据规模	较小	大数据（超出数据库处理能力）
可扩展性	一般（Oracle理论最多100台）	优秀（其实就是Hadoop的扩展性）

posted @ 2021-06-01 10:07 Karl1 阅读(84) 评论(0) 收藏举报

刷新页面返回顶部