摘要: 1.相关函数说明 CONCAT(string A/col, string B/col…): 返回输入字符串连接后的结果,支持任意个输入字符串; CONCAT_WS(separator, str1, str2,...): 它是一个特殊形式的 CONCAT()。 第一个参数剩余参数间的分隔符。 分隔符可 阅读全文
posted @ 2019-11-05 23:59 tunan96 阅读(3643) 评论(0) 推荐(0) 编辑
摘要: 数据准备 name dept_id sex 悟空 A 男 大海 A 男 宋宋 B 男 凤姐 A 女 婷姐 B 女 婷婷 B 女 需求 求出不同部门男女各多少人。结果如下: A 2 1 B 1 2 创建本地emp_sex.txt,导入数据 [atguigu@hadoop102 datas]$ vi e 阅读全文
posted @ 2019-11-05 23:14 tunan96 阅读(569) 评论(0) 推荐(0) 编辑
摘要: 函数说明: NVL:给值为NULL的数据赋值,它的格式是NVL( value,default_value)。 它的功能是如果value为NULL,则NVL函数返回default_value的值,否则返回value的值,如果两个参数都为NULL ,则返回NULL。 数据准备: 创建员工表: 导入数据: 阅读全文
posted @ 2019-11-05 22:20 tunan96 阅读(2351) 评论(0) 推荐(0) 编辑
摘要: 1 分桶表数据存储 分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区。对于一张表或者分区,Hive 可以进一步组织成桶,也就是更为细粒度的数据范围划分。 分桶是将数据集分解成更容易管理的若干部分的另一个技术。 分区针对的是数据的存储路径;分桶针对的是数据文件。 1. 阅读全文
posted @ 2019-11-05 22:14 tunan96 阅读(501) 评论(0) 推荐(0) 编辑
摘要: 1、等值Join Hive支持通常的SQL JOIN语句,但是只支持等值连接,不支持非等值连接。 案例实操 (1)根据员工表和部门表中的部门编号相等,查询员工编号、员工名称和部门名称 hive (default)> select e.empno, e.ename, d.deptno, d.dname 阅读全文
posted @ 2019-11-05 22:13 tunan96 阅读(192) 评论(0) 推荐(0) 编辑
摘要: GROUP BY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。 案例实操: (1)计算emp表每个部门的平均工资 hive (default)> select t.deptno, avg(t.sal) avg_sal from emp t group by 阅读全文
posted @ 2019-11-05 22:13 tunan96 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 1、全局排序(Order By) Order By:全局排序,只有一个Reducer 1.使用 ORDER BY 子句排序 ASC(ascend): 升序(默认) DESC(descend): 降序 2.ORDER BY 子句在SELECT语句的结尾 3.案例实操 (1)查询员工信息按工资升序排列 阅读全文
posted @ 2019-11-05 22:13 tunan96 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 1.使用WHERE子句,将不满足条件的行过滤掉 2.WHERE子句紧随FROM子句 3.案例实操 查询出薪水大于1000的所有员工 hive (default)> select * from emp where sal >1000; 1 比较运算符(Between/In/ Is Null) 1)下面 阅读全文
posted @ 2019-11-05 22:12 tunan96 阅读(836) 评论(0) 推荐(0) 编辑
摘要: 1、全表和特定列查询 创建部门表 create table if not exists dept( deptno int, dname string, loc int ) row format delimited fields terminated by '\t'; 创建员工表 create tab 阅读全文
posted @ 2019-11-05 22:12 tunan96 阅读(1038) 评论(0) 推荐(0) 编辑
摘要: 一、切换root身份不同 1、su命令:su只是切换了root身份,但Shell环境仍然是普通用户的Shell;而su -连用户和Shell环境一起切换成root身份了。只有切换了Shell环境才不会出现PATH环境变量错误,报command not found的错误。 2、su - 命令:su切换 阅读全文
posted @ 2019-11-05 20:25 tunan96 阅读(1431) 评论(0) 推荐(0) 编辑
摘要: echo [选项] [输出内容] 选项: -e:支持反斜线控制的字符转换 -n:取消输出后行末的换行符号 在 echo 命令中如果使用了"-e"选项,则可以支持控制字符 控制字符作 用 \\ 输出\本身 \a 输出警告音 \b 退格键,也就是向左删除键 \c 取消输出行末的换行符。和“-n”选项一致 阅读全文
posted @ 2019-11-05 20:25 tunan96 阅读(642) 评论(0) 推荐(1) 编辑
摘要: netstat 命令用于显示各种网络相关信息,如网络连接,路由表,接口状态 (Interface Statistics),masquerade 连接,多播成员 (Multicast Memberships) 等等 常见参数 -a (all)显示所有选项,默认不显示LISTEN相关-t (tcp)仅显 阅读全文
posted @ 2019-11-05 20:24 tunan96 阅读(1116) 评论(0) 推荐(0) 编辑
摘要: 占位符! 阅读全文
posted @ 2019-11-05 20:23 tunan96 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 占位符! 阅读全文
posted @ 2019-11-05 20:22 tunan96 阅读(97) 评论(0) 推荐(0) 编辑
摘要: 来源:https://www.cnblogs.com/skywang12345/p/3602369.html 侵删 归并排序介绍 将两个的有序数列合并成一个有序数列,我们称之为"归并"。归并排序(Merge Sort)就是利用归并思想对数列进行排序。根据具体的实现,归并排序包括"从上往下"和"从下往 阅读全文
posted @ 2019-11-05 15:14 tunan96 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 来源:https://www.cnblogs.com/skywang12345/p/3596746.html 侵删 快速排序介绍 快速排序(Quick Sort)使用分治法策略。它的基本思想是:选择一个基准数,通过一趟排序将要排序的数据分割成独立的两部分;其中一部分的所有数据都比另外一部分的所有数据 阅读全文
posted @ 2019-11-05 15:12 tunan96 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 来源:http://www.cnblogs.com/skywang12345/p/3596232.html 侵删 冒泡排序介绍 冒泡排序(Bubble Sort),又被称为气泡排序或泡沫排序。 它是一种较简单的排序算法。它会遍历若干次要排序的数列,每次遍历时,它都会从前往后依次的比较相邻两个数的大小 阅读全文
posted @ 2019-11-05 15:09 tunan96 阅读(110) 评论(0) 推荐(0) 编辑