摘要: 在大规模数据量的数据分析及建模任务中,往往针对全量数据进行挖掘分析时会十分耗时和占用集群资源,因此一般情况下只需要抽取一小部分数据进行分析及建模操作。Hive提供了数据取样(SAMPLING)的功能,能够根据一定的规则进行数据抽样,目前支持数据块抽样,分桶抽样和随机抽样,具体如下所示: 数据块抽样( 阅读全文
posted @ 2020-12-15 15:36 温家三哥 阅读(3677) 评论(0) 推荐(0) 编辑
摘要: LTV概念 用户终身价值(life time value) 解释 LTV是在一定时间内,某一客户可能为企业带来的利润额. 顾客终身价值是指企业在获得新顾客后的一段时间内,每一位顾客的平均利润净现值。(该解释取自百度百科) 作用 1、对比各日(或各批次)新注册用户的质量,为日后导人做决策依据(所有会影 阅读全文
posted @ 2020-12-10 16:37 温家三哥 阅读(2663) 评论(0) 推荐(0) 编辑
摘要: Hive中HSQL中left semi join和INNER JOIN、LEFT JOIN、RIGHT JOIN、FULL JOIN区别 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进 阅读全文
posted @ 2020-12-10 16:15 温家三哥 阅读(2945) 评论(0) 推荐(0) 编辑
摘要: DateDiff 函数详解 描述返回两个日期之间的时间间隔。 语法DateDiff(interval, date1, date2 [,firstdayofweek][, firstweekofyear]])DateDiff 函数的语法有以下参数:interval 必选。字符串表达式,表示用于计算 d 阅读全文
posted @ 2020-11-03 20:16 温家三哥 阅读(3225) 评论(0) 推荐(0) 编辑
摘要: coalesce函数 具体怎么用呢? 上面的函数说明通俗来说coalesce()的作用是:返回传入的参数中第一个非null的值。expre1不为空值则返回expre1;否则判断expre2是否是空值,如果expre2不为空值则返回expre2;否则判断expre3是否是空值,如果expre3不为空值 阅读全文
posted @ 2020-11-03 15:22 温家三哥 阅读(4419) 评论(0) 推荐(0) 编辑
摘要: 大道至简,德为根本 每一句经典的背后,都有着它的主人独特的思维模式与可以充分发挥的时空格局。 电视剧《天道》丁元英的10句经典台词,醍醐灌顶,起码一生读一次,品之胜读10年书! 这部根据作家豆豆的作品改编的电视剧,尽显丁元英之类所谓顶尖人物成大事的格局、智慧和术谋等顶级水平,被誉为商界的圣经,生意场 阅读全文
posted @ 2020-07-09 20:02 温家三哥 阅读(6000) 评论(0) 推荐(0) 编辑
摘要: 恢复内容开始 一、DAS、NAS、SAN在存储领域的位置 随着主机、磁盘、网络等技术的发展,数据存储的方式和架构也在一直不停改变,本文主要介绍目前主流的存储架构。 根据服务器类型分为: 封闭系统的存储(封闭系统主要指大型机) 开放系统的存储(开放系统指基于Windows、UNIX、Linux等操作系 阅读全文
posted @ 2020-06-25 15:36 温家三哥 阅读(1977) 评论(0) 推荐(0) 编辑