摘要: GROUP BY 子句:将数据分成若干组 GROUP BY 子句中列名/字段名的书写顺序,并不影响最终的分组结果。 分组结果的聚合 PS:1.将一类 行中多条数据 的情况,视作一种错误。 例子: 这样的话虽然是7列4行,但是SQL只会分析其“市场部' 组、'运营部' 组、'设计部' 组 这个 分组  阅读全文
posted @ 2022-10-25 22:37 去揽一池星河 阅读(64) 评论(0) 推荐(0)
摘要: 子查询 AIPL漏斗分析 Ⅰ: ①作为取值范围 像这样,用一对圆括号 () 包裹,作为一个元素参与到外层查询中的查询,被称为 子查询。 ps:此时的子查询,是外层查询中 WHERE 子句的一部分,所以从语法角度而言,它并不是一条完整的子句,末尾是不可以加分号的。再从语句功能看,它是 item_id  阅读全文
posted @ 2022-10-25 22:37 去揽一池星河 阅读(133) 评论(0) 推荐(0)
摘要: P9: 比特(bit)和字节(byte) ● 一个0或者一个1存储为一个比特(bt),是计算机中最小的存储单位 ● 计算机中是最基本的存储单元是字节(byte)每个字节由8个比特构成(即8个二进制单位)。 千字节(kilobyte,KB)=1024B 兆字节(megabyte,MB) =1024KB 阅读全文
posted @ 2022-10-25 22:37 去揽一池星河 阅读(25) 评论(0) 推荐(0)
摘要: 1.选择排序:使用数组中的元素跟其他元素逐个进行比较,根据规则交换位置. 阅读全文
posted @ 2022-10-25 22:37 去揽一池星河 阅读(31) 评论(0) 推荐(0)
摘要: 一、配置环境前准备 1、更改主机名 vi /etc/hostname #将文件中内容删除,添加上本机主机名 如果编辑 文件时出现一下错误: 执行命令 ls -a /路径 查询出隐藏文件找到与当前文件名一致的隐藏文件,将该隐藏文件删除,再次执行编辑命令即可 2、域名映射 #各个节点修改 hosts 文 阅读全文
posted @ 2022-10-25 13:40 去揽一池星河 阅读(496) 评论(0) 推荐(0)
摘要: Hive数据分析 1、Hive基本概念 1.1、Hive简介 1.1.1、什么是Hive Hive由Facebook实现并开源,基于Hadoop的一个数据仓库工具,可以将结构化的数据映射为一张数据库表,并提供HQL(Hive SQL)查询功能,底层数据是存储在HDFS上。Hive的本质是将SQL语句 阅读全文
posted @ 2022-10-24 20:56 去揽一池星河 阅读(259) 评论(0) 推荐(0)
摘要: 当遇到centos mysql密码忘记了的情况,参考以下方法解决 1、vi /etc/my.cnf 2、在[mysqld]中添加 skip-grant-tables 例如: [mysqld] skip-grant-tables datadir=/var/lib/MySQL socket=/var/l 阅读全文
posted @ 2022-10-23 13:14 去揽一池星河 阅读(448) 评论(0) 推荐(0)
摘要: 一、安装maven 1.解压maven安装包,将加压后的安装包放在没有中文路径的目录下 2.创建仓库文件夹repository(理论上任何位置都是可以的,建议和maven文件夹同级别,这样好管理一些) 3. 要修改settings文件,进入到 apache-maven-3.5.4\conf目录下 4 阅读全文
posted @ 2022-10-21 20:32 去揽一池星河 阅读(219) 评论(0) 推荐(0)
摘要: Hive Bucketed Tables 分桶表 分桶表也是桶表( bucket) 是一种用于优化查询而设计的表类型 分桶表把数据文件在底层分解若干个部分(被拆分某干个小文件) 分桶要指定字段分到哪个分桶 分桶规则:桶编号相同的数据回分到同一个桶里面 hash_function 取决于分桶字段buc 阅读全文
posted @ 2022-10-21 20:16 去揽一池星河 阅读(246) 评论(0) 推荐(0)
摘要: Hive 内部表、外部表 什么是内部表 内部表(Internal table)也称为被Hive拥有和管理的托管表(Managed table)。 默认情况下创建的表就是内部表,Hive拥有该表的结构和文件。换句话说,Hive完全管理表(元数据和数据)的生命周期,类似于RDBMS中的表。 当您删除内部 阅读全文
posted @ 2022-10-20 20:02 去揽一池星河 阅读(103) 评论(0) 推荐(0)