上一页 1 ··· 6 7 8 9 10 11 12 13 下一页
摘要: Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hi 阅读全文
posted @ 2021-01-07 09:15 大数据技术派 阅读(6599) 评论(0) 推荐(1) 编辑
摘要: 本文大纲 UDF 简介 Hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。编写Hive UDF的步骤: 添加相关依赖,创建 阅读全文
posted @ 2020-12-31 09:14 大数据技术派 阅读(1007) 评论(0) 推荐(0) 编辑
摘要: Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hi 阅读全文
posted @ 2020-12-26 10:54 大数据技术派 阅读(753) 评论(0) 推荐(0) 编辑
摘要: Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hi 阅读全文
posted @ 2020-12-23 22:35 大数据技术派 阅读(10642) 评论(0) 推荐(0) 编辑
摘要: 关注公众号:大数据技术派,回复: 资料,领取1024G资料。 一. Sqoop介绍 Sqoop是一个用来将Hadoop和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:MySQL、Oracle、Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到 阅读全文
posted @ 2020-12-22 21:56 大数据技术派 阅读(5891) 评论(2) 推荐(1) 编辑
摘要: Hive系列文章 Hive表的基本操作 Hive中的集合数据类型 Hive动态分区详解 hive中orc格式表的数据导入 Java通过jdbc连接hive 通过HiveServer2访问Hive SpringBoot连接Hive实现自助取数 hive关联hbase表 Hive udf 使用方法 Hi 阅读全文
posted @ 2020-12-21 21:32 大数据技术派 阅读(4240) 评论(0) 推荐(0) 编辑
摘要: 关注公众号:大数据技术派,回复: 资料,领取1024G资料。 hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。 UDF 阅读全文
posted @ 2020-12-21 13:04 大数据技术派 阅读(6416) 评论(1) 推荐(3) 编辑
摘要: 除了使用础的数据类型string等,Hive中的列支持使用struct, map, array集合数据类型。 数据类型 描述 语法示例 STRUCT 和C语言中的struct或者"对象"类似,都可以通过"点"符号访问元素内容。 struct{'John', 'Doe'} MAP MAP是一组键-值对 阅读全文
posted @ 2020-12-20 16:37 大数据技术派 阅读(1677) 评论(0) 推荐(0) 编辑
摘要: 先解释一下几个名词: - metadata :hive元数据,即hive定义的表名,字段名,类型,分区,用户这些数据。一般存储关系型书库mysql中,在测试阶段也可以用hive内置Derby数据库。 - metastore :hivestore服务端。主要提供将DDL,DML等语句转换为MapRed 阅读全文
posted @ 2020-12-18 17:12 大数据技术派 阅读(383) 评论(0) 推荐(0) 编辑
摘要: Lag和Lead分析函数可以在同一次查询中取出同一字段的后N行的数据(Lag)和前N行的数据(Lead)作为独立的列。 这种操作可以代替表的自联接,并且LAG和LEAD有更高的效率,其中over()表示当前查询的结果集对象,括号里面的语句则表示对这个结果集进行处理。 1 LEAD 与LAG相反,LE 阅读全文
posted @ 2020-12-17 14:53 大数据技术派 阅读(911) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 12 13 下一页