9/10
今日考题
1.简述对表查询基本思路
先查看表查询的要求明确大概方法(联表还是子查询)
然后根据要求一步步写注释写出思路
根据注释一步步完善SQL语句切莫着急跳步
2.python如何下载第三方模块,如何切换源,如何查错拍错
# 下载模块
1.通过cmd终端指令
pip install ...
2.通过pycharm左下的Terminal输入指令
pip install ...
3.通过pycharm快捷键
file setting ...
# 切换源
1.终端临时切换
加-i 仓库地址
2.pycharm切换
在下载第三方模块的地方点左下manage添加仓库地址
3.通过修改python配置文件永久修改
# 查错
1.有timeout
网的问题重试或者换网
2.有版本号的
版本太低 输入后面建议输入的代码
3.别的问题
百度解千愁
3.python如何操作mysql,尝试写出基本链接配置
import pymysql
conn=pymysql.connect(
host='127.0.0.1',
port=3306,
user='root',
password='123',
database='db1',
charset='utf8'
)
cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)
sql = 'select * from ...' # SQL语句
cursor.execute(sql) # 获取执行的结果
info_dict = cursor.fetchall()
print(info_dict)
复习巩固
- 多表查询练习
仔细理解题意
拆分步骤书写注释
按注释一步步翻译成SQL语句
# 一定要先明确思路(写注释)
- pip工具
pip是python专门用于下载第三方模块的
python外号:调包侠
# 下载模块
pip3 install 模块名 # pip后面的数字用于区分python版本
# 仓库地址
默认的模块来自国外 有时候下载会很慢
这时候就要借助国内的镜像源
百度搜: pip源
# 切换仓库地址
1.通过cmd命令
2.pycharm切换
3.修改配置文件(不推荐)
# 报错处理
1.timeout类
网络问题
2.版本问题
按提示输入指令
3.其他环境问题
百度
- pymysql模块
此模块相当于通过python远程连接mysql服务端操作
就相当于客服端
import pymysql
conn = pymysql.connect(
host = '127.0.0.1', # 本地通用
port = 3306, # mysql默认端口号
user = 'root',
passwd = '123',
db = 'practise',
charset = 'utf8'
)
cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)
# 固定语句 同时让取值变成字典放于列表之中 方便操作
sql = '这里放sql语句'
cursor.excute(sql) # 获取sql语句返回的结果
内容概要
- pymysql其他操作
- SQL注入
- 基于pymysql实现用户注册登录
- 事务
- 用户管理
- 索引
- mysql辅助知识
详细讲解
pymysql其他操作
import pymysql
conn = pymysql.connect(
host='127.0.0.1',
port=3306,
user='root',
passwd='123',
db='db1',
charset='utf8',
autocommit='True'
)
cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)
'''对于增删改查中的查来说 它所需的安全系数最小
所以直接能有结果
但是对于其他几项操作所需的安全系数就比较高
在pymysql执行sql语句后不会影响数据库'''
sql ="delete from user_info where id=1"
cursor.execute(sql) # 执行sql同时产生值 sql语句影响的数据行数
# 但是这个时候可以看到数据是没有被修改的
conn.commit() # 加入一个二次确认
'''在前面connect时候加上限制条件
autocommit=True # 自动确认'''
sql = "select * from user_info"
cursor.execute(sql)
print(cursor.fetchall()) # 从结果中获取所有的数据
print(cursor.fetchone()) # 从结果中获取一条数据
print(cursor.fetchmany(5)) # 从结果中获取几条数据
# 和文件读取类似有一个光标的限制读取后光会对应向后移动
cursor.scroll(3, 'relative') # 相对于当前位置左右移动 正数往右 负数往左
cursor.scroll(1,'absolute') # 相对于起始位置左右移动
SQL注入
import pymysql
# 先获取用户名和密码
username = input('请输入用户名>>>:').strip()
password = input('请输入密码>>>:').strip()
conn = pymysql.connect(
host='127.0.0.1',
port=3306,
user='root',
password='123', # 支持简写passwd
database='db1', # 支持简写db
charset='utf8',
autocommit=True # 自动确认
)
cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)
# 利用sql查询
sql = "select * from user_info where username=%s and password=%s" %(username,password)
cursor.execute(sql)
check = cursor.fetchall() # 获取执行结果
if check:
print('登录成功')
else:
print('登录失败')
'''但是这个时候神奇的地方出现了'''
'''
出大问题了没有用户名密码还能登录上
这现象就叫做sql注入
只需要把sql语句执行的时候发生了什么看一下一下子就明白了
在sql语句下面加上print(sql)
然后把结果复制进Naivcat
'''
sql语句后面的部分被变成注释了
再来看看另一个是什么情况
where条件之后是一个或判断
其中1=1成立了那就已经满足取值的条件了
那sql就可以理解成select * from user_info
'''
那这不是完蛋pymysql的梦幻登场不足一天就要退役了
其实解决方法也很简单
只要把涉及输入数据的部分都交给cursor.execute做就行了
'''具体操作如下
这样execute在执行期间就帮你把特殊符号啥的优化掉了
占位符也不用加引号了
总结一下
'''
利用一些特殊符号和特殊语法的形式
组合出违背编程者意愿的语句
就统称sql注入
解决方法:
涉及到关键性的数据不要自己手动拼接
交由固定的方法拼接 让方法自动过滤掉特殊符号
'''
用户管理
1.创建用户
create user 用户名 identified by '密码';
"""修改密码"""
set password for 用户名 = Password('新密码');
set password = Password('新密码'); # 针对当前登录用户
2.重命名
rename user 新用户名 to 旧用户名;
3.删除用户
drop user 用户名;
4.查看用户访问权限
show grants for 用户名;
5.授予访问权限
grant select on db1.* to 用户名;
# 授予用户对db1数据库下所有表使用select权限
6.撤销权限
revoke select on db1.* from 用户名;
"""
整个服务器
grant all/revoke all
整个数据库
on db.*
特定的表
on db.t1
"""
事物
四大特征: ACID
A:原子性
事务和原子一样 一旦形成就变成一个完整个体
即其中指令 不可分割 要么全部完成要么全部失败
C:一致性
事务必须从一个一致性的状态变为另一个一致性状态
类似于能量守恒
I:独立性
事务与事务之间不会互相影响
区别于替身使者 事务不会互相吸引
D:持久性
事务一旦被提交了对数据库改变就是永久得到
create table user(
id int primary key auto_increment,
name char(32),
balance int
);
insert into user(name,balance)
values
('jason',1000),
('ace',1000),
('leo',1000);
# 修改数据前开启事务操作
start transaction;
# 中间随便改
update user set balance=0 where name='jason';
update user set balance=1500 where name='ace';
update user set balance=1500 where name='leo';
# 最后记得把事务状态结束
rollback; # 回到上面一个状态
# 确认没问题之后确认
commit; # 确认完不能回退
视图
# 1、什么是视图
视图就是通过查询得到一张虚拟表,然后保存下来,下次直接使用即可
# 2、为什么要用视图
如果要频繁使用一张虚拟表,可以不用重复查询
# 3、如何用视图
create view teacher_course as
select * from teacher inner join course on teacher.tid = course.teacher_id;
'''视图虽然好用但是不推荐使用
会造成表看起来很混乱
后续维护等很麻烦'''
触发器
https://blog.csdn.net/babycan5/article/details/82789099?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163136808716780271554799%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=163136808716780271554799&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-4-82789099.pc_search_result_control_group&utm_term=mysql%E8%A7%A6%E5%8F%91%E5%99%A8&spm=1018.2226.3001.4187
函数
# 相对于pythpn中的内置方法
"ps:可以通过help 函数名 查看帮助信息!"
# 1.移除指定字符
Trim、LTrim、RTrim
# 2.大小写转换
Lower、Upper
# 3.获取左右起始指定个数字符
Left、Right
# 4.返回读音相似值(对英文效果)
Soundex
"""
eg:客户表中有一个顾客登记的用户名为J.Lee
但如果这是输入错误真名其实叫J.Lie,可以使用soundex匹配发音类似的
where Soundex(name)=Soundex('J.Lie')
"""
# 5.日期格式:date_format
'''在MySQL中表示时间格式尽量采用2022-11-11形式'''
CREATE TABLE blog (
id INT PRIMARY KEY auto_increment,
NAME CHAR (32),
sub_time datetime
);
INSERT INTO blog (NAME, sub_time)
VALUES
('第1篇','2015-03-01 11:31:21'),
('第2篇','2015-03-11 16:31:21'),
('第3篇','2016-07-01 10:21:31'),
('第4篇','2016-07-22 09:23:21'),
('第5篇','2016-07-23 10:11:11'),
('第6篇','2016-07-25 11:21:31'),
('第7篇','2017-03-01 15:33:21'),
('第8篇','2017-03-01 17:32:21'),
('第9篇','2017-03-01 18:31:21');
select date_format(sub_time,'%Y-%m'),count(id) from blog group by date_format(sub_time,'%Y-%m');
1.where Date(sub_time) = '2015-03-01'
2.where Year(sub_time)=2016 AND Month(sub_time)=07;
# 更多日期处理相关函数
adddate 增加一个日期
addtime 增加一个时间
datediff 计算两个日期差值
...
流程控制
# if条件语句
if i = 1 then
select 1;
elseif i = 2 then
select 2;
else
select 7;
end if;
# while循环语句
set num = 0 ;
while num < 10 DO
select
num ;
set num = num + 1 ;
end while ;
索引
索引就是一种数据结构,类似于书的目录。
意味着以后在查数据应该先找目录再找数据,而不是用翻页的方式查询数据
索引在MySQL中也叫做"键",是存储引擎用于快速找到记录的一种数据结构
主键 primary key
除了可以加快查询之外还有其他的功能
唯一键 unique
除了可以加快查询之外还有其他的功能
索引键 index key
除了可以加快查询之外没有其他的功能
外键 foreign key # 比较特殊
跟索引半毛钱关系都没有 也不存在提升查询速度一说
索引的影响
在表中有大量数据的前提下 创建索引速度会很慢
在索引创建完毕后 对表的查询性能会大幅度提升 但是写的性能会降低
'''
有一张表按照name字段查询数据 速度很慢 如何解决?
将name字段制作索引
小结论:可以简单的认为按照什么字段查询慢就把改字段制作成索引
是不是一遇到查询比较慢,就把对应的字段做成索引?
并不是 如果一个表索引很多那之后再写入数据会非常麻烦
所以上面的办法不能用于极端情况
'''
聚集索引(primary key)
叶子结点放的一条条完整的记录
辅助索引(unique,index)
叶子结点存放的是辅助索引字段对应的那条记录的主键的值
'下图是B树模型'
# 覆盖索引
只在辅助索引的叶子节点中就已经找到了所有我们想要的数据
select name from user_info where username='leo';
# 非覆盖索引
虽然查询的时候命中了索引字段name,但是要查的是age字段,所以还需要利用主键才去查找
select age from user_info where username='leo';
实操数据
#1. 准备表
create table s1(
id int,
name varchar(20),
gender char(6),
email varchar(50)
);
#2. 创建存储过程,实现批量插入记录
delimiter $$ #声明存储过程的结束符号为$$
create procedure auto_insert1()
BEGIN
declare i int default 1;
while(i<3000000)do
insert into s1 values(i,'jason','male',concat('jason',i,'@oldboy'));
set i=i+1;
end while;
END$$ #$$结束
delimiter ; #重新声明分号为结束符号
#3. 查看存储过程
show create procedure auto_insert1\G
#4. 调用存储过程
call auto_insert1();
# 表没有任何索引的情况下
select * from s1 where id=30000;
# 避免打印带来的时间损耗
select count(id) from s1 where id = 30000;
select count(id) from s1 where id = 1;
# 给id做一个主键
alter table s1 add primary key(id); # 速度很慢
select count(id) from s1 where id = 1; # 速度相较于未建索引之前两者差着数量级
select count(id) from s1 where name = 'jason' # 速度仍然很慢
"""
范围问题
"""
# 并不是加了索引,以后查询的时候按照这个字段速度就一定快
select count(id) from s1 where id > 1; # 速度相较于id = 1慢了很多
select count(id) from s1 where id >1 and id < 3;
select count(id) from s1 where id > 1 and id < 10000;
select count(id) from s1 where id != 3;
alter table s1 drop primary key; # 删除主键 单独再来研究name字段
select count(id) from s1 where name = 'jason'; # 又慢了
create index idx_name on s1(name); # 给s1表的name字段创建索引
select count(id) from s1 where name = 'jason' # 仍然很慢!!!
"""
再来看b+树的原理,数据需要区分度比较高,而我们这张表全是jason,根本无法区分
那这个树其实就建成了“一根棍子”
"""
select count(id) from s1 where name = 'xxx';
# 这个会很快,我就是一根棍,第一个不匹配直接不需要再往下走了
select count(id) from s1 where name like 'xxx';
select count(id) from s1 where name like 'xxx%';
select count(id) from s1 where name like '%xxx'; # 慢 最左匹配特性
# 区分度低的字段不能建索引
drop index idx_name on s1;
# 给id字段建普通的索引
create index idx_id on s1(id);
select count(id) from s1 where id = 3; # 快了
select count(id) from s1 where id*12 = 3; # 慢了 索引的字段一定不要参与计算
drop index idx_id on s1;
select count(id) from s1 where name='jason' and gender = 'male' and id = 3 and email = 'xxx';
# 针对上面这种连续多个and的操作,mysql会从左到右先找区分度比较高的索引字段,先将整体范围降下来再去比较其他条件
create index idx_name on s1(name);
select count(id) from s1 where name='jason' and gender = 'male' and id = 3 and email = 'xxx'; # 并没有加速
drop index idx_name on s1;
# 给name,gender这种区分度不高的字段加上索引并不难加快查询速度
create index idx_id on s1(id);
select count(id) from s1 where name='jason' and gender = 'male' and id = 3 and email = 'xxx'; # 快了 先通过id已经讲数据快速锁定成了一条了
select count(id) from s1 where name='jason' and gender = 'male' and id > 3 and email = 'xxx'; # 慢了 基于id查出来的数据仍然很多,然后还要去比较其他字段
drop index idx_id on s1
create index idx_email on s1(email);
select count(id) from s1 where name='jason' and gender = 'male' and id > 3 and email = 'xxx'; # 快 通过email字段一剑封喉
"""联合索引"""
select count(id) from s1 where name='jason' and gender = 'male' and id > 3 and email = 'xxx';
# 如果上述四个字段区分度都很高,那给谁建都能加速查询
# 给email加然而不用email字段
select count(id) from s1 where name='jason' and gender = 'male' and id > 3;
# 给name加然而不用name字段
select count(id) from s1 where gender = 'male' and id > 3;
# 给gender加然而不用gender字段
select count(id) from s1 where id > 3;
# 带来的问题是所有的字段都建了索引然而都没有用到,还需要花费四次建立的时间
create index idx_all on s1(email,name,gender,id); # 最左匹配原则,区分度高的往左放
select count(id) from s1 where name='jason' and gender = 'male' and id > 3 and email = 'xxx'; # 速度变快
第一范式
# 确保每列的原子性
原子是物理学上所说的最小单位
那确保每列原子性的意思就是
'确保设计出的数据库每列数据无法再被进一步细分'
第二范式
# 确保表中的每列都和主键相关
主键是只有一列 什么怎么样叫于主键相关呢
'每个表只用于描述一件事物'
第三范式
# 确保每列都和主键列直接相关,而不是间接相关
要满足第三范式有一个先决条件就是一定要能够满足第二范式
其次什么叫每列数据于主键列直接相关呢就是这两个数据要有明确的关系
比如 人名年龄 人名职务
举个例子:
公司里面发工资按照职务发每个职务的日薪固定
那 人名和职务还有直接关系嘛 就没直接关系了
所以职务要分去另一张表