摘要: 原链接:http://www.cnblogs.com/yunfeifei/p/3850440.html 1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使 阅读全文
posted @ 2017-10-24 20:08 柒君子 阅读(182) 评论(0) 推荐(0) 编辑
摘要: Hive2.0函数大全(中文版) 摘要 Hive内部提供了很多函数给开发者使用,包括数学函数,类型转换函数,条件函数,字符函数,聚合函数,表生成函数等等,这些函数都统称为内置函数。 目录 数学函数 集合函数 类型转换函数 日期函数 条件函数 字符函数 聚合函数 表生成函数 数学函数 Return T 阅读全文
posted @ 2017-10-24 19:54 柒君子 阅读(8299) 评论(0) 推荐(0) 编辑
摘要: SDK是Software Development Kit的缩写,中文意思是“软件开发工具包”。 这是一个覆盖面相当广泛的名词,可以这么说:辅助开发某一类软件的相关文档、范例和工具的集合都可以叫做“SDK”。SDK是一系列文件的组合,它为软件的开发提供一个平台(它为软件开发使用各种API提供便利)。 阅读全文
posted @ 2017-08-25 13:42 柒君子 阅读(461) 评论(0) 推荐(0) 编辑
摘要: 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持;而利用Hadoop做数据分析依然存在诸多障碍,例如大多数分析师只习惯使用SQL, 阅读全文
posted @ 2017-08-23 17:32 柒君子 阅读(388) 评论(0) 推荐(0) 编辑
摘要: 脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。 在数据库技术中,脏数据在临时更新(脏读)中产生。例如:事务A更新了某个数据项X,但是由于某种原因,事务A出现了问题,于是要把A回滚。但是在回滚之前,另一个事务B读取了数 阅读全文
posted @ 2017-08-23 17:10 柒君子 阅读(505) 评论(0) 推荐(0) 编辑