摘要: 一般我们出分档数据都是case when ,但是如果是对年龄等一些字段进行细分,比如五岁一档,我们如果用case when就会特别麻烦,写的特别多,这里我介绍一种简单的方法,对细分的字段进行处理: 建表: create table dim_ia_age (age varchar2(50)) 源数据为 阅读全文
posted @ 2018-10-31 17:10 夏日的向日葵 阅读(830) 评论(0) 推荐(0) 编辑
摘要: udf是对hive上的每行(单行)数据操作,现在我要实现对hive上的一列数据操作,udf函数已经满足不了我的要求了,使用udaf对hive的一列求最大值; 代码如下: 按照这种格式写各种函数; 打成jar包(打jar包的步骤我之前的博客里有详细描述) 将jar包和测试数据导入linux 登入hiv 阅读全文
posted @ 2018-10-31 16:51 夏日的向日葵 阅读(785) 评论(0) 推荐(0) 编辑
摘要: 使用maths3函数进行简单的数据统计性描述; 使用场景:本地,直接运行就可以; 具体后面有个性化的需求,可以再修改~ 个人认为,使用这些函数关键是知道他的公式和用法,能准确定位,有一些方法,我也找不到它的公式,只是罗列上了,欢迎批评指正~ 阅读全文
posted @ 2018-10-31 16:18 夏日的向日葵 阅读(5457) 评论(0) 推荐(1) 编辑
摘要: 目标:读文件 编程时,有很多时候需要读取本地文件,下面介绍一下读取方式: 读单行文件 结果输出: from:https://blog.csdn.net/huludan/article/details/54095751 阅读全文
posted @ 2018-10-31 15:26 夏日的向日葵 阅读(56377) 评论(0) 推荐(0) 编辑