10 2022 档案
摘要:count(*):对行的数目进行计算,包含NULL,count(1)这个用法和count(*)的结果是一样的。 如果表没有主键,那么count(1)比count(*)快。表有主键,count(*)会自动优化到主键列上。 count(1):所有行进行统计,包括NULL行count(column):对c
阅读全文
摘要:接着上Hive 大数据开发(一套打通)继续写 PS:最好是手敲代码一遍,有些代码可能是中文输入法打出来的,因为SQL代码块显示不出来Hive语法,导致看不出来到底是什么地方出现错误。所以盲目的直接复制粘贴会出现报错信息 用到的flights文件链接: 链接:https://pan.baidu.com
阅读全文
摘要:1.选择排序:使用数组中的元素跟其他元素逐个进行比较,根据规则交换位置.
阅读全文
摘要:P9: 比特(bit)和字节(byte) ● 一个0或者一个1存储为一个比特(bt),是计算机中最小的存储单位 ● 计算机中是最基本的存储单元是字节(byte)每个字节由8个比特构成(即8个二进制单位)。 千字节(kilobyte,KB)=1024B 兆字节(megabyte,MB) =1024KB
阅读全文
摘要:子查询 AIPL漏斗分析 Ⅰ: ①作为取值范围 像这样,用一对圆括号 () 包裹,作为一个元素参与到外层查询中的查询,被称为 子查询。 ps:此时的子查询,是外层查询中 WHERE 子句的一部分,所以从语法角度而言,它并不是一条完整的子句,末尾是不可以加分号的。再从语句功能看,它是 item_id
阅读全文
摘要:GROUP BY 子句:将数据分成若干组 GROUP BY 子句中列名/字段名的书写顺序,并不影响最终的分组结果。 分组结果的聚合 PS:1.将一类 行中多条数据 的情况,视作一种错误。 例子: 这样的话虽然是7列4行,但是SQL只会分析其“市场部' 组、'运营部' 组、'设计部' 组 这个 分组
阅读全文
摘要:SQL常用函数 ①函数的概念: 1.函数的格式:函数名(参数) 即:函数名(参数1, 参数2, ....) 三个注意事项:Ⅰ:英括号 Ⅱ:英逗 Ⅲ:逗号后面加空格 2.datetime()函数:datetime(x,`unixepoch`) 其中:x是需要处理的日期字段 unixepoch是原日期字
阅读全文
摘要:排序与运算 ①字段间的计算 tip:1.也就是说把算式内容看做x,y就可以了 2.指定字段之间按行继续计算,然后结果被保存为一个新字段。 PS:SQLite 中,两个浮点数相除,结果依然为浮点数,但两个整数相除后还是整数,小数部分则被自动舍去了。如果某列数据需要参与除法运算,把数据类型设为整数就很容
阅读全文
摘要:windows不区分大小写且区别中英文 java区分大小写 第一个代码文件: class HelloChina{ public static void main(String[] args){ System.out.println("HelloWorld!"); } } 过程(用命令指示建立):记事
阅读全文
摘要:P24: 1.5 Java语言的环境搭建 什么是JDK,JRE JDK(Java Development Kit Java开发工具包) JDK是提供给Java开发人员使用的,其中包含了java的开发工具,也包括了JRE。所以安装了JDK,就不用在单独安装JRE了。 其中的开发工具:编译工具(java
阅读全文
摘要:数据筛选 演出信息管理 WHERE 子句 ①WHERE 子句:根据WHERE子句中的条件筛选数据 此句根据SLECET...FORM....中使用 ②数值筛选 1. 等于:= 2. 不等于:<>(部分 DBMS 也支持 !=) 3. 小于:< 4. 小于等于:<= 5. 大于:> 6 .大于等于:>
阅读全文
摘要:p21: 1.2软件开发介绍 常用的DOS命令(windows+R cmd) >dir:列出当前目录下的文件以及文件夹 >md:创建目录 >rd:删除目录 >cd:进入指定目录 >cd.:退回到上一级目录 >cdl:退回到根目录 >del:删除文件 >exit:退出dos命令行 √补充:echo j
阅读全文
摘要:SQLite数据类型: 三种数据类型:1.分别是专门用来表示 整数 的 INTEGER,以及用来表示带小数点的数字,也就是 浮点数 的 REAL。整数、浮点数类型, 2.用来表示 文本 类型信息的 TEXT 类型 SO,得出两个规律:1.储存可以进行加减乘除等运算的数值时,最好使用 INTEGER
阅读全文
摘要:1: SQL初识 数据库,SQL与数据表 1:数据库 数据库 (Data Base,简写为 DB) 是用于保存数据的容器。你可以把它想象成一个虚拟的“文件柜”,其中可以放入多个“文件”,按照一定的结构保存和管理数据。 2:关系型数据库 支持使用 SQL 操作的数据库也被称为 关系型数据库,这也是目前
阅读全文
摘要:一、配置环境前准备 1、更改主机名 vi /etc/hostname #将文件中内容删除,添加上本机主机名 如果编辑 文件时出现一下错误: 执行命令 ls -a /路径 查询出隐藏文件找到与当前文件名一致的隐藏文件,将该隐藏文件删除,再次执行编辑命令即可 2、域名映射 #各个节点修改 hosts 文
阅读全文
摘要:Hive数据分析 1、Hive基本概念 1.1、Hive简介 1.1.1、什么是Hive Hive由Facebook实现并开源,基于Hadoop的一个数据仓库工具,可以将结构化的数据映射为一张数据库表,并提供HQL(Hive SQL)查询功能,底层数据是存储在HDFS上。Hive的本质是将SQL语句
阅读全文
摘要:当遇到centos mysql密码忘记了的情况,参考以下方法解决 1、vi /etc/my.cnf 2、在[mysqld]中添加 skip-grant-tables 例如: [mysqld] skip-grant-tables datadir=/var/lib/MySQL socket=/var/l
阅读全文
摘要:一、安装maven 1.解压maven安装包,将加压后的安装包放在没有中文路径的目录下 2.创建仓库文件夹repository(理论上任何位置都是可以的,建议和maven文件夹同级别,这样好管理一些) 3. 要修改settings文件,进入到 apache-maven-3.5.4\conf目录下 4
阅读全文
摘要:Hive Bucketed Tables 分桶表 分桶表也是桶表( bucket) 是一种用于优化查询而设计的表类型 分桶表把数据文件在底层分解若干个部分(被拆分某干个小文件) 分桶要指定字段分到哪个分桶 分桶规则:桶编号相同的数据回分到同一个桶里面 hash_function 取决于分桶字段buc
阅读全文
摘要:Hive 内部表、外部表 什么是内部表 内部表(Internal table)也称为被Hive拥有和管理的托管表(Managed table)。 默认情况下创建的表就是内部表,Hive拥有该表的结构和文件。换句话说,Hive完全管理表(元数据和数据)的生命周期,类似于RDBMS中的表。 当您删除内部
阅读全文