day_31
昨日回顾
GIL全局解释锁
python解释器
- Cpython(C语言编写)
- Jpython(Java编写)
- Ppython(Python编写)
GIL全局解释锁
基于CPython来研究全局解释器锁,因为CPython的内存线程不是安全的
- GIL本质上是一个互斥锁
- GIL是为了阻止同一个进程内多个线程同时执行(并行)
- GIL的存在就是为了保证线程安全
注意:多个线程过来执行,一旦遇到IO操作,就会立马释放GIL解释器锁,交给下一个先进来的线程
多线程的作用
计算密集型程序
- 在单核情况下,若一个任务需要10s
- 开启进程,消耗资源大,执行4个进程需要40s
- 开启线程,消耗资源小,执行4个线程需要40s
- 在多核情况下,若一个任务需要10s
- 开启进程,并行执行,效率较高,执行4个进程需要10s
- 开启线程,并发执行,效率较低,执行4个线程需要40s
IO密集型程序
- 在单核情况下,若一个任务需要10s
- 开启进程,消耗资源大,执行4个进程需要40s
- 开启线程,消耗资源小,执行4个线程需要40s
- 在多核情况下,若一个任务需要10s
- 开启进程,并行执行,效率小于线程,因为遇到IO会立即切换CPU执行权限,执行4个进程需要10s = 开启进程的额外时间
- 开启线程,并发执行,效率高于进程,执行4个线程需要40s
死锁现象
死锁是指两个或两个以上的进程或线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程 ,解决方式就是递归锁
递归锁
递归锁,在Python中为了支持在同一线程中多次请求同一资源,python提供了可重入锁RLock。
这个RLock内部维护着一个Lock和一个counter变量,counter记录了acquire的次数,从而使得资源可以被多次require。直到一个线程所有的acquire都被release,其他的线程才能获得资源。
信号量
信号量Semaphore管理一个内置的计数器,
每当调用acquire()时内置计数器-1;
调用release() 时内置计数器+1;
计数器不能小于0;当计数器为0时,acquire()将阻塞线程直到其他线程调用release()
注意: 与进程池是完全不同的概念,进程池Pool(4),最大只能产生4个进程,而且从头到尾都只是这四个进程,不会产生新的,而信号量是产生一堆线程/进程
线程队列
线程队列
queue队列:使用import queue
,用法与进程Queue一样
先进先出
FIFO队列: 先进先出 class queue.Queue(maxsize=0)
后进先出
LIFO队列: 后进先出 class queue.LifoQueue(maxsize=0 )
优先级队列
优先级队列: 根据参数内,数字的大小进行分级,数字值越小,优先级越高class queue.PriorityQueue(maxsize=0)
put进入一个元组,元组的第一个元素是优先级(通常是数字,也可以是非数字之间的比较),数字越小优先级越高
今日内容
Event事件
Event事件的作用
- 用来控制线程的执行
- 由一些线程去控制另一些线程
进程池与线程池
-
什么是进程池与线程池
进程池与线程池是用来控制当前程序允许创建(进程/线程)的数量
-
进程池与线程池的作用
保证在硬件允许的范围内创建(进程/线程)的数量
-
如何使用
from concurrent.futures import ProcessPoolExecutor, ThreadPoolExecutor import time # ProcessPoolExecutor(5) # 5代表只能开启5个进程 # ProcessPoolExecutor() # 默认以CPU的个数限制进程数 pool = ThreadPoolExecutor(5) # 5代表只能开启5个线程 -5 +1 -1 +1 -1 # ThreadPoolExecutor() # 默认以CPU个数 * 5 限制线程数 # t = Tread() # 异步提交 # t.start(0) # pool.submit('传函数地址') # 异步提交任务 # def task(): # print('线程任务开始了...') # time.sleep(1) # print('线程任务结束了...') # # # for line in range(5): # pool.submit(task) # 异步提交任务 # pool.submit('传函数地址').add_done_callback('回调函数地址') def task(res): # res == 1 print('线程任务开始了...') time.sleep(1) print('线程任务结束了...') return 123 # 回调函数 def call_back(res): print(type(res)) # 注意: 赋值操作不要与接收的res同名 res2 = res.result() print(res2) for line in range(5): pool.submit(task, 1).add_done_callback(call_back) # 会让所有线程池的任务结束后,才往下执行代码 # pool.shutdown() print('hello')
协程
- 进程:资源单位
- 线程:执行单位
- 协程:在单线程下实现并发
注意:协程不是操作系统资源,他是程序起的名字,为了让单线程能实现并发
协程的目的
-
操作系统:
多到技术,切换+保存状态
- 遇到IO
- CPU执行时间过长
-
协程
通过手动模拟操作系统“多到技术”,实现 切换+保存状态
- 手动实现 遇到IO切换,欺骗操作系统误以为没有IO操作
- 单线程 计算密集型,来回切换+保存状态时,反而效率更低
优点:
在IO密集型的情况下,会提高效率
缺点:
若在计算密集型的情况下,来回切换,反而效率更低
如何实现协程:切换+保存状态
- yield:保存状态
- 并发:切换