摘要: hive hive是基于hadoop的一个数据仓库工具,可将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可将sql转换为MapReduce任务运行。hive不适合用于联机事务处理,也不提供实时查询,他适合应用在基于大量不可变的批处理作业。 hive架构分为四个部分: 用户接口: 阅读全文
posted @ 2013-03-07 16:54 孟尧 阅读(1286) 评论(0) 推荐(0) 编辑