摘要:
Hive数据类型 参考:中文博客:http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2843448.html 英文:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Types 1、列类型 TINYINT SMALLINT INT BIGINT BOOLEAN FLOAT DOUBLE STRING BINARY(Hive 0.8.0以上才可用) TIMESTAMP(Hive 0.8.0以上才可用) 2、复合类型 arrays:ARRAY maps:MAP str 阅读全文
摘要:
Hive与关系型数据库的比较 使用Hive的CTL(命令行接口)时,你会感觉它很像是在操作关系型数据库,但是实际上,Hive和关系型数据库有很大的不同。 1)Hive和关系型数据库存储文件的系统不同。 Hive使用HDFS(hadoop的分布式文件系统),关系型数据库则是服务器本地的文件系统; 2)Hive使用的计算模型是MapReduce,而关系型数据库则是自己设计的计算模型。 3)Hive是为海量数据做数据挖掘设计的,实时性差;而关系型数据库是为实时查询的业务进行设计的。 4)Hive很容易扩展自己的存储能力和计算能力,这个是继承hadoop的,而关系型数据库在这方面相对较差。(世界上最大 阅读全文
摘要:
我本人大概是从2013年12月份开始接触Hadoop,因为公司当时要开始处理一些数据量比较大的数据,现有的通过程序去统计数据的方式在效率方面渐渐不能满足业务需求,所以便开始了Hadoop技术的探索,即使到目前已经使用了4个月,感觉自己懂得的只是皮毛,但这丝毫没有影响我,对技术的掌握本来就是越练越熟的过程。之所以整理所学的东西,写在博客中,主要有两个目的:1)通过整理博客巩固所学知识 2)分享给其它的朋友,方便共同学习,共同进步。对于Hive,我也没有专门地去看专业书籍,Hive本身可以看成是一个数据库,熟悉SQL语句的人可以在Hive中完成很大一部分工作,Hadoop的全套技术中,我目前只对. 阅读全文
该文被密码保护。 阅读全文