2019 年 11月 5 日随笔档案 - tunan96

2019年11月5日

摘要： 1．相关函数说明 CONCAT(string A/col, string B/col…)：返回输入字符串连接后的结果，支持任意个输入字符串; CONCAT_WS(separator, str1, str2,...)：它是一个特殊形式的 CONCAT()。第一个参数剩余参数间的分隔符。分隔符可阅读全文

posted @ 2019-11-05 23:59 tunan96 阅读(3643) 评论(0) 推荐(0) 编辑

Hive_CASE WHEN

摘要：数据准备 name dept_id sex 悟空 A 男大海 A 男宋宋 B 男凤姐 A 女婷姐 B 女婷婷 B 女需求求出不同部门男女各多少人。结果如下： A 2 1 B 1 2 创建本地emp_sex.txt，导入数据 [atguigu@hadoop102 datas]$ vi e 阅读全文

posted @ 2019-11-05 23:14 tunan96 阅读(569) 评论(0) 推荐(0) 编辑

Hive_空字段赋值

摘要：函数说明： NVL：给值为NULL的数据赋值，它的格式是NVL( value，default_value)。它的功能是如果value为NULL，则NVL函数返回default_value的值，否则返回value的值，如果两个参数都为NULL ，则返回NULL。数据准备：创建员工表：导入数据：阅读全文

posted @ 2019-11-05 22:20 tunan96 阅读(2351) 评论(0) 推荐(0) 编辑

Hive_分桶表存储数据

摘要： 1 分桶表数据存储分区提供一个隔离数据和优化查询的便利方式。不过，并非所有的数据集都可形成合理的分区。对于一张表或者分区，Hive 可以进一步组织成桶，也就是更为细粒度的数据范围划分。分桶是将数据集分解成更容易管理的若干部分的另一个技术。分区针对的是数据的存储路径；分桶针对的是数据文件。 1．阅读全文

posted @ 2019-11-05 22:14 tunan96 阅读(501) 评论(0) 推荐(0) 编辑

Hive_Join语句

摘要： 1、等值Join Hive支持通常的SQL JOIN语句，但是只支持等值连接，不支持非等值连接。案例实操（1）根据员工表和部门表中的部门编号相等，查询员工编号、员工名称和部门名称 hive (default)> select e.empno, e.ename, d.deptno, d.dname 阅读全文

posted @ 2019-11-05 22:13 tunan96 阅读(192) 评论(0) 推荐(0) 编辑

Hive_GroupBy语句

摘要： GROUP BY语句通常会和聚合函数一起使用，按照一个或者多个列队结果进行分组，然后对每个组执行聚合操作。案例实操：（1）计算emp表每个部门的平均工资 hive (default)> select t.deptno, avg(t.sal) avg_sal from emp t group by 阅读全文

posted @ 2019-11-05 22:13 tunan96 阅读(276) 评论(0) 推荐(0) 编辑

Hive_排序查询

摘要： 1、全局排序（Order By） Order By：全局排序，只有一个Reducer 1．使用 ORDER BY 子句排序 ASC（ascend）: 升序（默认） DESC（descend）: 降序 2．ORDER BY 子句在SELECT语句的结尾 3．案例实操（1）查询员工信息按工资升序排列阅读全文

posted @ 2019-11-05 22:13 tunan96 阅读(171) 评论(0) 推荐(0) 编辑

Hive_Where语句

摘要： 1．使用WHERE子句，将不满足条件的行过滤掉 2．WHERE子句紧随FROM子句 3．案例实操查询出薪水大于1000的所有员工 hive (default)> select * from emp where sal >1000; 1 比较运算符（Between/In/ Is Null） 1）下面阅读全文

posted @ 2019-11-05 22:12 tunan96 阅读(836) 评论(0) 推荐(0) 编辑

Hive_基本查询（Select…From )

摘要： 1、全表和特定列查询创建部门表 create table if not exists dept( deptno int, dname string, loc int ) row format delimited fields terminated by '\t'; 创建员工表 create tab 阅读全文

posted @ 2019-11-05 22:12 tunan96 阅读(1038) 评论(0) 推荐(0) 编辑

su与su -的区别

摘要：一、切换root身份不同 1、su命令：su只是切换了root身份，但Shell环境仍然是普通用户的Shell；而su -连用户和Shell环境一起切换成root身份了。只有切换了Shell环境才不会出现PATH环境变量错误，报command not found的错误。 2、su - 命令：su切换阅读全文

posted @ 2019-11-05 20:25 tunan96 阅读(1431) 评论(0) 推荐(0) 编辑

echo命令详解

摘要： echo [选项] [输出内容] 选项： -e：支持反斜线控制的字符转换 -n：取消输出后行末的换行符号在 echo 命令中如果使用了"-e"选项，则可以支持控制字符控制字符作用 \\ 输出\本身 \a 输出警告音 \b 退格键，也就是向左删除键 \c 取消输出行末的换行符。和“-n”选项一致阅读全文

posted @ 2019-11-05 20:25 tunan96 阅读(642) 评论(0) 推荐(1) 编辑

netstat命令详解

摘要： netstat 命令用于显示各种网络相关信息，如网络连接，路由表，接口状态 (Interface Statistics)，masquerade 连接，多播成员 (Multicast Memberships) 等等常见参数 -a (all)显示所有选项，默认不显示LISTEN相关-t (tcp)仅显阅读全文

posted @ 2019-11-05 20:24 tunan96 阅读(1116) 评论(0) 推荐(0) 编辑

grep命令详解

摘要：占位符！阅读全文

posted @ 2019-11-05 20:23 tunan96 阅读(93) 评论(0) 推荐(0) 编辑

find命令详解

摘要：占位符！阅读全文

posted @ 2019-11-05 20:22 tunan96 阅读(97) 评论(0) 推荐(0) 编辑

归并排序

摘要：来源：https://www.cnblogs.com/skywang12345/p/3602369.html 侵删归并排序介绍将两个的有序数列合并成一个有序数列，我们称之为"归并"。归并排序(Merge Sort)就是利用归并思想对数列进行排序。根据具体的实现，归并排序包括"从上往下"和"从下往阅读全文

posted @ 2019-11-05 15:14 tunan96 阅读(141) 评论(0) 推荐(0) 编辑

快速排序

摘要：来源：https://www.cnblogs.com/skywang12345/p/3596746.html 侵删快速排序介绍快速排序(Quick Sort)使用分治法策略。它的基本思想是：选择一个基准数，通过一趟排序将要排序的数据分割成独立的两部分；其中一部分的所有数据都比另外一部分的所有数据阅读全文

posted @ 2019-11-05 15:12 tunan96 阅读(122) 评论(0) 推荐(0) 编辑

冒泡排序

摘要：来源：http://www.cnblogs.com/skywang12345/p/3596232.html 侵删冒泡排序介绍冒泡排序(Bubble Sort)，又被称为气泡排序或泡沫排序。它是一种较简单的排序算法。它会遍历若干次要排序的数列，每次遍历时，它都会从前往后依次的比较相邻两个数的大小阅读全文

posted @ 2019-11-05 15:09 tunan96 阅读(110) 评论(0) 推荐(0) 编辑

tunan96

空谈毫无用处，要不断实践和反思

公告