CHANG_09

2022年6月16日

摘要： Hadoop MapReduce 的 Shuffle 阶段是指从 Map 的输出开始，包括系统执行排序，以及传送 Map 输出到 Reduce 作为输入的过程。排序阶段是指对 Map 端输出的 Key 进行排序的过程。不同的 Map 可能输出相同的 Key，相同的 Key 必须发送到同一个 Redu 阅读全文

posted @ 2022-06-16 10:35 CHANG_09 阅读(105) 评论(0) 推荐(0) 编辑

2022年6月15日

SQL21 查找在职员工自入职以来的薪水涨幅情况

摘要： drop table if exists `employees` ; drop table if exists `salaries` ;CREATE TABLE `employees` (`emp_no` int(11) NOT NULL,`birth_date` date NOT NULL,`fi 阅读全文

posted @ 2022-06-15 19:22 CHANG_09 阅读(50) 评论(0) 推荐(0) 编辑

SQL18 获取当前薪水第二多的员工的emp_no以及其对应的薪水salary

摘要： #SQL18 获取当前薪水第二多的员工的emp_no以及其对应的薪水salarydrop table if exists `employees` ; drop table if exists `salaries` ; CREATE TABLE `employees` (`emp_no` int(11 阅读全文

posted @ 2022-06-15 16:17 CHANG_09 阅读(35) 评论(0) 推荐(0) 编辑

获取每个部门中当前员工薪水最高的相关信息

摘要： drop table if exists `dept_emp` ; drop table if exists `salaries` ; CREATE TABLE `dept_emp` (`emp_no` int(11) NOT NULL,`dept_no` char(4) NOT NULL,`fro 阅读全文

posted @ 2022-06-15 14:48 CHANG_09 阅读(14) 评论(0) 推荐(0) 编辑

离线数仓建模、表的类型分类

摘要：关系建模：遵循三范式 1.基本字段不可再分割 2.其他字段对主键完全依赖 3.其他字段间不存在传递依赖关系维度建模：星型模型雪花模型星座模型实体表维度表(码表) 事实表事实表的分类：事务型事实表周期型快照事实表累积型快照事实表按数据同步分类：全量表增量表同步新增及变化数据的表阅读全文

posted @ 2022-06-15 09:22 CHANG_09 阅读(87) 评论(0) 推荐(0) 编辑

dwd层维度退化的作用

摘要： dwd层除了数据清洗 cast(id as bigint)>0 and id is not 之外，维度退化的作用将三级分类省市、区域等小表提前 join 成商品分类、地区表等避免后期频繁join 影响查询效率阅读全文

posted @ 2022-06-15 08:50 CHANG_09 阅读(367) 评论(0) 推荐(0) 编辑

2022年6月14日

业务数据分层建模仓库

摘要：阅读全文

posted @ 2022-06-14 20:41 CHANG_09 阅读(15) 评论(0) 推荐(0) 编辑

软件分发状况

摘要： jdk 分发 flume 分发阅读全文

posted @ 2022-06-14 09:44 CHANG_09 阅读(11) 评论(0) 推荐(0) 编辑

hadoop集群搭建

摘要： [root@hadoop106 ~]# vim /etc/hostnamehadoop106 vim /etc/sysconfig/network hostname=hadoop106vim /etc/hosts 47.100.210.196 hadoop106139.196.139.79 hado 阅读全文

posted @ 2022-06-14 09:13 CHANG_09 阅读(28) 评论(0) 推荐(0) 编辑

阿里云主机网络安全端口

摘要：授权 0.0.0.0/0 所有网络可以访问该端口阅读全文

posted @ 2022-06-14 09:08 CHANG_09 阅读(25) 评论(0) 推荐(0) 编辑

公告