摘要: VMware打开虚拟机没反应的解决方案 VMware打开虚拟机无反应的解决方案(全面汇总)虚拟机没反应的解决办法大概是如下几点:一.若是第一次安装后打不开虚拟机,大致是如下两种解决方案:1.大多数时候,虚拟机打不开都是因为防火墙拦截所致.解决方案:断网,关闭杀毒软件(360,腾讯管家等),关闭防火墙 阅读全文
posted @ 2021-11-24 16:25 小阿政 阅读(799) 评论(0) 推荐(1) 编辑
摘要: 以前在学这个函数的时候,上课睡着了,哈哈哈,没注意听,讲一下agg函数的用法。 首先,你需要先知道他的使用场景,知道使用场景了你才能灵活的去运用它。 我们一般主要使用它做一下分组后的聚合操作与groupBy函数一起使用,也可以单独使用对整体进行聚合操作。 下面给大家在网上找了一段非常不错的代码: 1 阅读全文
posted @ 2021-11-09 20:11 小阿政 阅读(1573) 评论(0) 推荐(0) 编辑
摘要: 1.今天工作的时候刚知道dropduplicates对这个函数。 首先distinct和dropDuplicates都是用来进行去重的。区别在于distinct是根据每一条数据进行完整内容的比对和去重,dropDuplicates可以根据指定的字段进行去重。 下面讲一下dropDuplicates的 阅读全文
posted @ 2021-11-09 20:00 小阿政 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 数据库是面向事务处理的,数据是由日常的业务产生的,并且是频繁更新的,这是我们常说的?那么什么是事务那? 1.事务(Transaction)是并发控制的基本单位。所谓的事务,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。在关系型数据库中,一个事务可以是一条sql,一组 阅读全文
posted @ 2021-11-08 20:18 小阿政 阅读(246) 评论(0) 推荐(0) 编辑
摘要: 下面这几个是我们经常用到的 ^ 表示开头 $ 表示结尾 . 表示任意字符 * 表示任意多个我从其他的博主下面找的图片: / 做为转意,即通常在"/"后面的字符不按原来意义解释,如/b/匹配字符"b",当b前面加了反斜杆后//b/,转意为匹配一个单词的边界。 -或- 对正则表达式功能字符的还原,如"* 阅读全文
posted @ 2021-11-08 19:11 小阿政 阅读(1248) 评论(0) 推荐(0) 编辑
摘要: 一、unix_timestamp函数用法 此函数是返回时间的时间戳: 有以下两种用法: 1 select unix_timestamp(); --返回当前时间的时间戳 2.2)如果参数date满足yyyy-MM-dd HH:mm:ss形式,则可以直接unix_timestamp(string dat 阅读全文
posted @ 2021-11-08 18:28 小阿政 阅读(1566) 评论(0) 推荐(0) 编辑
摘要: 数仓面试重灾区-Generic User-defined Table Generating Function UDTF 这玩意对数仓同学来讲,熟悉又陌生,主要一方面是大量接触,另一方面是理解上有误导,还一个就是不是太明白里头到底咋回事。 场景切入 关于UDTF面试场景大概有以下的问题:1、hive的 阅读全文
posted @ 2021-11-07 21:28 小阿政 阅读(935) 评论(0) 推荐(0) 编辑
摘要: 连续登录问题: 实现思路: 1.因为每天用户登录次数可能不止一次,所以需要先将用户每天的登录日期去重。 2.再用row_number() over(partition by _ order by _)函数将用户id分组,按照登陆时间进行排序。 3.计算登录日期减去第二步骤得到的结果值,用户连续登陆情 阅读全文
posted @ 2021-11-07 20:41 小阿政 阅读(432) 评论(0) 推荐(0) 编辑
摘要: hive中一共有以下几种建表方式: create table person(id int,name string,hobbies array<string>,address map<string,string>)row format delimitedfields terminated by ',' 阅读全文
posted @ 2021-09-24 12:56 小阿政 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 订阅专栏 1.数据仓库建模的目的? 为什么要进行数据仓库建模?大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑 访问性能:能够快速查询所需的数据,减少数据I/O 数据成本:减少不必要的数据冗余,实现计算结果数据复用,降 阅读全文
posted @ 2021-09-24 12:50 小阿政 阅读(586) 评论(0) 推荐(0) 编辑