GIL全局解释器锁及协程
GIL全局解释器锁
1、什么是GIL全局解释器锁
GIL本质是一把互斥锁,相当于执行权限,每个进程内都会存在一把GIL同一进程内的多线程,必须抢到GIL之后才能使用Cpython解释器来执行自己的代码,即同一进程下的多个线程无法实现并行,但可以实现并发
Cpython解释器下想实现并行可以开启多个进程
2、为何要有GIL
因为Cpython解释器的垃圾回收机制不是线程安全的,保证了数据的安全
3、GIL全局解释器的优缺点
优点:保证了数据安全
缺点:单个进程下开启多个线程只能实现并发不能实现并行
4、选择多进程还是多线程?
单核或多核I/O密集型下使用:多线程
单核计算密集型下使用:多线程
多核计算密集型下使用:多进程
多cpu,意味着可以有多个核并行完成计算,所以多核提升的是计算性能
每个cpu一旦遇到I/O阻塞,仍然需要等待,所以多核对I/O操作没什么用处
对于一个程序来说不可能是纯IO型或者纯计算型,我们只能相对的判断是IO密集型还是计算密集型,来选择多进程还是多线程
单核情况下:
开启四个任务是计算密集型的,没有多核来并行计算,开多个进程,只是徒增进程的开销内存资源,应该使用多线程
开启四个任务是IO密集型的,开启多进程也是徒增,来回切换的速度还不如开启多线程的,所以应该使用多线程
多核情况下:
开启四个任务是计算密集型的,多核意味着多个CPU去计算,开启多进程可以同一时刻去计算,所以应该使用多进程
开启四个任务是IO密集型的,再多的核也在在等待,来回切换的速度进程不如线程的,所以应该使用多线程
5、多线程多进程多核下性能测试
from multiprocessing import Process
from threading import Thread
import os
import time
# 计算密集型
def task1():
i = 0
for line in range(110000000):
i += 1
if __name__ == '__main__':
print(os.cpu_count()) # 查看计算机几核的
list1 = []
start_time = time.time()
for i in range(4):
p1 = Process(target=task1) # 4进程下: 17.369488954544067
# t1 = Thread(target=task1) # 4线程下: 27.991361618041992
p1.start()
# t1.start()
# list1.append(t1)
list1.append(p1)
for i in list1:
i.join()
end_time = time.time()
print(end_time - start_time)
# IO密集型
def task2():
time.sleep(1)
if __name__ == '__main__':
print(os.cpu_count())
start_time = time.time()
list2 = []
for i in range(40):
# p2 = Process(target=task2) #40进程下: 11.374541282653809
t2 = Thread(target=task2) # 40线程下: 1.010239839553833
# p2.start()
t2.start()
# list2.append(p2)
list2.append(t2)
for i in list2:
i.join()
end_time = time.time()
print(end_time - start_time)
协程
1、什么是协程
进程:资源单位
线程:执行单位
协程:单线程下实现并发
在I/O密集型的情况下,使用协程提高执行效率
手动的实现在同一线程下 “ 遇到I/O切换+保存状态 ” 让操作系统误以为没有I/O操作,将CPU执行权限继续交给你
即:在单线程下实现多个任务遇到IO就切换可以降低单线程的IO时间,从而最大限度的提升单线程的效率
2、实现协程
gevent模块:遇到I/O自动切换并保存状态
使用gevent模块中的monkey,monkey.patch_all()来监视是否遇到IO操作,再使用spawn来创建协程,使用joinall替代join,使协程运行完再结束线程,joinall中放入得到的对象到列表中
from gevent import spawn
from gevent import joinall
from gevent import monkey
import time
# 补丁:监听所有的任务是否有IO操作
monkey.patch_all()
def task1(name):
print(f'{name}开始')
time.sleep(1)
print(f'{name}结束')
def task2():
print('task2开始')
time.sleep(3)
print('task2结束')
def task3():
print('task3开始')
time.sleep(5)
print('task3结束')
if __name__ == '__main__':
start_time = time.time()
# 创建协程
sp1 = spawn(task1,'task1')
sp2 = spawn(task2)
sp3 = spawn(task3)
# sp1.join()
# sp2.join()
# sp3.join()
joinall([sp1, sp2, sp3]) # 相当于 sp.join(),注意放入列表中
end_time = time.time()
print(end_time - start_time)
# task1开始
# task2开始
# task3开始
# task1结束
# task2结束
# task3结束
# 5.013161897659302