摘要: 1. 表business 2.需求 2.1 查询在2017年4月份购买过的顾客及总人数 2.2 查询顾客的购买明细及月购买总额 2.3 将每个顾客的cost按照日期进行累加 ① ② ③ ④ ⑤ ⑥ ⑦ 2.4 查询每个顾客上次的购买时间 2.5 查询前20%时间的订单信息 ① ② 阅读全文
posted @ 2024-05-13 23:12 白森 阅读(5) 评论(0) 推荐(0) 编辑
摘要: ● 测试表 test 1. grouping sets ① 未使用 ② 使用grouping sets (与上面等价) 【代码实例】 查看代码 --todo 方式一 --所有学校的人数总和 select '全学校' as school, '全年级' as grade, count(name) as 阅读全文
posted @ 2024-05-13 23:12 白森 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 1 算数运算符 主要用于数学运算 运算符 名称 示例 + 加法 SELECT A+B - 减法 SELECT A-B * 乘法 SELECT A*B / 或 DIV 除法 SELECT A/B % 或 MOD 求模(求余) SELECT A%B 1.1 加法与剑法运算符 SELECT 100, 10 阅读全文
posted @ 2024-05-13 23:12 白森 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 1 函数的理解 2 数值函数 2.1 基本函数 函数 用法 ABS(x) 返回x的绝对值 SIGN(X) 返回X的符号。正数返回1,负数返回-1,0返回0 PI() 返回圆周率的值 CEIL(x),CEILING(x) 返回大于或等于某个值的最小整数 FLOOR(x) 返回小于或等于某个值的最大整数 阅读全文
posted @ 2024-05-13 23:12 白森 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 一、连续问题 ▶ 如下数据为蚂蚁森林中用户领取的减少碳排放量 问题:找出连续3天及以上,减少碳排放量在100以上的用户。 思路: ① t1 ② t2 ③ t3 ④ 最终版 二、分组问题 ▶ 如下电商公司用户访问时间数据 ( ts单位:秒 ) 问题:某个用户连续的访问记录,如果时间间隔<60秒,则分为 阅读全文
posted @ 2024-05-13 23:12 白森 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 1 聚合函数 ● 聚合函数作用于一组数据,并对一组数据返回一个值。 ● 不能嵌套调用。 1.1 AVG和SUM函数 ● 使用对象:数值型数据 SELECT AVG(salary), MAX(salary),MIN(salary), SUM(salary) FROM employees WHERE j 阅读全文
posted @ 2024-05-13 23:11 白森 阅读(3) 评论(0) 推荐(0) 编辑
摘要: 1 窗口函数 阅读全文
posted @ 2024-05-13 23:11 白森 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 一、count 1. distinct 只能放在查询字段的最前面,不能放在查询字段的中间或者后面 【案例】 ①表stu ②对name去重 ③对name,age去重 阅读全文
posted @ 2024-05-13 23:11 白森 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 1 MapReduce概述 1.1 MapReduce定义 ● 分布式运算程序的编程框架 ● 开发“基于Hadoop的数据分析应用”的核心框架 ● 核心功能:将用户编写的业务逻辑代码+自带默认组件 —>整合为分布式运算程序,并发运行在Hadoop集群上。 1.2 MapReduce优缺点 1.2.1 阅读全文
posted @ 2024-05-13 23:11 白森 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 1 数据仓库概述 1.1 数据仓库概念 ● 数据仓库:一个为数据分析而设计的企业级数据管理系统。 ● 可集中、整合多个信息源的大量数据。 1.2 数据仓库核心架构 2 数据仓库建模概述 2.1 数据仓库建模的意义 ● 生活引入:如果把数据看作图书馆的数,我们希望看到他们在书架上分门别类地放置。 ● 阅读全文
posted @ 2022-05-13 10:09 白森 阅读(917) 评论(0) 推荐(0) 编辑