Python 线程池进程池 异步回调 协程 IO模型
#1.创建池子
#2.submit 提交任务
#3.shutdown 可以用于等待所有任务完成后销毁池
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor import time,os # 创建进程池,指定最大进程数为3,此时不会创建进程,不指定数量时,默认为CPU核数 pool = ProcessPoolExecutor(3) def task(): time.sleep(1) print(os.getpid(),"working..") if __name__ == '__main__': for i in range(10): # 开启10个任务 pool.submit(task) # 提交任务时立即创建进程 # pool.shutdown() # 关闭池子( 等待池子中所有的任务执行完毕之后 才会往下运行代码,相当于一阻塞) print(1)
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor from threading import current_thread,active_count import time # 创建进程池,指定最大线程数为3,此时不会创建线程,不指定数量时,默认为CPU和核数*5 pool = ThreadPoolExecutor(3) print(active_count()) # 只有一个主线 def task(): time.sleep(1) print(current_thread().name,"working..") if __name__ == '__main__': for i in range(10): pool.submit(task) # 第一次提交任务时立即创建线程 pool.shutdown() # 阻塞到所有任务完成,关闭池子 print(2)
池子中创建的进程/线程创建一次就不会再创建了
至始至终用的都是最初的那几个
这样的话节省了反复开辟进程/线程的资源
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor # 任务 def task(n): print(n,os.getpid()) # 查看当前进程号 time.sleep(2) return n**2 # 回调函数 n def call_back(n): print('拿到了异步提交任务的返回结果:',n.result()) pool = ProcessPoolExecutor() # 默认是当前计算机cpu的个数 if __name__ == '__main__': f = pool.submit(task,10) # 得到的是任务结果对象future f.add_done_callback(call_back) # 指定回调函数,并将结果对象自动传入 # 简便写法 pool.submit(task,10).add_done_callback(call_back)
总结:异步回调使用方法就是在提交任务后得到一个Futures对象,调用对象的add_done_callback来指定一个回调函数。
2.注意:
# res = pool.submit(get_data,url).result() # 同步的方式(串行阻塞)等待任务结果 将导致所有请求任务不能并发(相当于res.result())
程序员自己通过代码自己检测程序中的IO,一旦遇到IO自己通过代码切换,给操作系统的感觉是你这个线程没有任何的IO。
ps:欺骗操作系统 让它误认为你这个程序一直没有IO,从而保证程序在运行态和就绪态来回切换,提升代码的运行效率。
2.协程有缺点:
优点:
#1. 协程的切换开销更小,属于程序级别的切换,操作系统完全感知不到,因而更加轻量级
#2. 单线程内就可以实现并发的效果,最大限度地利用cpu
缺点:
#1. 协程的本质是单线程下,无法利用多核,可以是一个程序开启多个进程,每个进程内开启多个线程,每个线程内开启协程来尽可能提高效率
#2. 协程本质是单个线程,因而一旦协程出现阻塞,将会阻塞整个线程
3.使用
from gevent import monkey;monkey.patch_all() # 由于该模块经常被使用 所以建议写成一行 from gevent import spawn import time """ 注意gevent模块没办法自动识别time.sleep等io情况 需要你手动再配置一个参数 """ def task1(): print("task1 run") # gevent.sleep(3) time.sleep(3) print("task1 over") def task2(): print("task2 run") # gevent.sleep(1) time.sleep(1) print("task2 over") g1 = gevent.spawn(task1) g2 = gevent.spawn(task2) #gevent.joinall([g1,g2]) g1.join() g2.join() # 执行以上代码会发现不会输出任何消息 # 这是因为协程任务都是以异步方式提交,所以主线程会继续往下执行,而一旦执行完最后一行主线程也就结束了, # 导致了协程任务没有来的及执行,所以这时候必须join来让主线程等待协程任务执行完毕 也就是让主线程保持存活 # 后续在使用协程时也需要保证主线程一直存活,如果主线程不会结束也就意味着不需要调用join
需要注意:
1.如果主线程结束了 协程任务也会立即结束。
必须在打补丁后再使用相应的功能,避免忘记,建议写在最上方