摘要: Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需 要的内 阅读全文
posted @ 2016-11-23 22:43 记忆残留 阅读(2859) 评论(0) 推荐(0) 编辑
摘要: #创建表人信息表 person(String name,int age) hive> create table person(name STRING,age INT)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ESCAPED BY '\\' STOR 阅读全文
posted @ 2016-11-23 21:34 记忆残留 阅读(1771) 评论(0) 推荐(0) 编辑
摘要: 最近在学习使用Hive(版本0.13.1)的过程中,发现了一些坑,它们或许是Hive提倡的比关系数据库更加自由的体现(同时引来一些问题),或许是一些bug。总而言之,这些都需要使用Hive的开发人员额外注意。本文旨在列举我发现的3个通过查询语句向表中插入数据过程中的问题,希望大家注意。 为了验证接下 阅读全文
posted @ 2016-11-23 21:11 记忆残留 阅读(24298) 评论(0) 推荐(0) 编辑