摘要: 简介: hive是建立在hadoop之上的数据仓库,一般用于对大型数据集的读写和管理,存在hive里的数据实际上就是存在HDFS上,都是以文件的形式存在,不能进行读写操作,所以我们需要元数据或者说叫schem来对hdfs上的数据进行管理。那元数据表之间有没有什么关联呢?答案是肯定的。hive默认元数 阅读全文
posted @ 2019-04-23 13:50 任重而道远的小蜗牛 阅读(10585) 评论(0) 推荐(0) 编辑
摘要: UDF的定义 UDF(User-Defined Functions)即是用户定义的hive函数。hive自带的函数并不能完全满足业务需求,这时就需要我们自定义函数了 UDF的分类 这三类中,我们只对UDF类的函数进行改写 这三类中,我们只对UDF类的函数进行改写 pom文件配置 UDF函数编写 打j 阅读全文
posted @ 2019-04-23 12:01 任重而道远的小蜗牛 阅读(43949) 评论(1) 推荐(3) 编辑