1、基于 Hadoop 的一个数据仓库工具
2、可以将结构化的数据映射为一张数据库表
3、提供 HQL(Hive SQL)查询功能
4、底层数据是存储在 HDFS 上
5、本质是将 SQL 语句转换为 MapReduce 任务运行
6、使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据,适用于离线的批量数据计算