摘要: 参考书籍:《The Elements of Statistical Learning》和 UTC ppt. 阅读全文
posted @ 2019-03-05 06:30 旁人爱标签 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 1.Hive基本操作 2. Select操作详解 a.使用ALL和DISTINCT选项区分对重复记录的处理,默认是ALL。 b.Where条件,支持AND,OR,IN ,NOT IN,不支持EXIST 和 NOT EXIST。 c.Order by全局排序,只有一个Reduce任务。Sort by 阅读全文
posted @ 2019-03-05 04:13 旁人爱标签 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 1. Hive什么 a.Hive是基于Hadoop的一个数据仓库工具(注意不是数据仓库),将结构化的数据文件映射成一张数据库表。 b.Hive是SQL的解析引擎,可以把sql语句转换成MapReduce,但也允许自定义mr程序。 c.Hive不适合用于联机(online)事务处理,也不提供实时查询功 阅读全文
posted @ 2019-03-05 04:11 旁人爱标签 阅读(256) 评论(0) 推荐(0) 编辑