摘要: 1.概述 继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍。 2.介绍 首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题。 job 阅读全文
posted @ 2018-09-20 14:38 ZackSun 阅读(336) 评论(0) 推荐(0) 编辑
摘要: 1.概述 上一章《那些年使用Hive踩过的坑》介绍了Hive的基本架构及原理,加下来介绍Hive的基本操作和一些注意事项。 2.基本操作 2.1Create Table 2.1.1介绍  CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 IF NOT 阅读全文
posted @ 2018-09-20 14:37 ZackSun 阅读(316) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/smartloli/ 1.概述 这个标题也是用血的教训换来的,希望对刚进入hive圈的童鞋和正在hive圈爬坑的童鞋有所帮助。打算分以下几个部分去描述: Hive的结构 Hive的基本操作 Hive Select Hive Join Hive UDF H 阅读全文
posted @ 2018-09-20 14:36 ZackSun 阅读(258) 评论(0) 推荐(0) 编辑