02进程
内容均参考https://www.cnblogs.com/linhaifeng/p/7278389.html,https://www.cnblogs.com/xiaoyuanqujing/p/11636160.html,感谢分享
一、进程的概念
进程是资源分配和调度的基本单位,进程是程序在处理器上的一次执行过程,进程是能独立运行的基本单位。
进程是动态的,程序是静止的,进程是程序的执行。
进程的三种基本状态:
就绪态、执行态、阻塞态
二、进程的组成
进程是由程序控制块(PCB)、程序段、数据段组成。
操作系统是通过PCB来管理进程,因此PCB中应该包含操作系统对其进行管理所需的各种信息,
如进程描述信息、进程控制和管理信息、资源分配清单和处理机相关信息。
程序段:程序代码存放的位置。
数据段:程序运行时使用、产生的运算数据。如全局变量、局部变量、宏定义的常量就存放在数据段内。
三、 multiprocessing模块
python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),
在python中大部分情况需要使用多进程。Python提供了multiprocessing。
multiprocessing模块用来开启子进程,并在子进程中执行我们定制的任务(比如函数),
该模块与多线程模块threading的编程接口类似。
multiprocessing模块的功能众多:支持子进程、通信和共享数据、执行不同形式的同步,
提供了Process、Queue、Pipe、Lock等组件。
四、Process类
Process([group [, target [, name [, args [, kwargs]]]]]),由该类实例化得到的对象,表示一个子进程中的任务
强调:
1. 需要使用关键字的方式来指定参数
2. args指定的为传给target函数的位置参数,是一个元组形式,必须有逗号
参数介绍:
group参数未使用,值始终为None
target表示调用对象,即子进程要执行的任务
args表示调用对象的位置参数元组,args=(1,2,'egon',)
kwargs表示调用对象的字典,kwargs={'name':'egon','age':18}
name为子进程的名称
方法介绍:
p.start():启动进程,并调用该子进程中的p.run()
p.run():进程启动时运行的方法,正是它去调用target指定的函数,我们自定义类的类中一定要实现该方法
p.terminate():强制终止进程p,不会进行任何清理操作,如果p创建了子进程,该子进程就成了僵尸进程,
使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放,进而导致死锁
p.is_alive():如果p仍然运行,返回True
p.join([timeout]):主线程等待p终止后才运行(强调:是主线程处于等的状态,而p是处于运行的状态)。
timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程
属性介绍:
p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,
当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建自己的新进程,必须在p.start()之前设置
p.name:进程的名称
p.pid:进程的pid
p.exitcode:进程在运行时为None、如果为–N,表示被信号N结束(了解即可)
p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。
这个键的用途是为涉及网络连接的底层进程间通信提供安全性,
这类连接只有在具有相同的身份验证键时才能成功(了解即可)
在windows中Process()必须放到# if __name__ == '__main__':下。
五、进程的创建
(1)方法一
import time import random from multiprocessing import Process def fun(name): print('{} start '.format(name)) time.sleep(random.randint(1,5)) print('{} end'.format(name)) if __name__ == '__main__': p1 = Process(target=fun, args=('cc',)) p2 = Process(target=fun, args=('dd',)) p3 = Process(target=fun, args=('ee',)) p1.start() p2.start() p3.start() print('主')
(2)方法二,构建自己的类,重写run()
import time import random from multiprocessing import Process class MyProcess(Process): def __init__(self, name): super().__init__()#调用父类构造方法 self.name = name def run(self): print('{} start '.format(self.name)) time.sleep(random.randint(1,5)) print('{} end'.format(self.name)) if __name__ == '__main__': p1 = MyProcess('cc') p2 = MyProcess('dd') p3 = MyProcess('ee') p1.start()#start()会自动调用run() p2.start() p3.start() print('主')
六、进程的内存空间是隔离的
from multiprocessing import Process n = 100 def fun(): global n n = 0 print('子进程内:',n) #子进程内: 0 if __name__ == '__main__': p = Process(target=fun) p.start() print('主进程内:', n)#主进程内: 100
七、join():主线程等待子线程终止
# p.join只能join住start开启的进程,而不能join住run开启的进程 from multiprocessing import Process import time import random def fun(name): print('{} start '.format(name)) time.sleep(random.randint(1,5)) print('{} end'.format(name)) if __name__ == '__main__': p = Process(target=fun, args=('cc',)) p.start() p.join()#主线程等待子线程终止后才会运行 print('主')
八、Process对象的其他方法或属性
# (1)terminate、name、pid from multiprocessing import Process import time import random class MyProcess(Process): def __init__(self, name): super().__init__() self.name = name #为开启的进程设置名字 def run(self): print('{} start '.format(self.name)) time.sleep(random.randint(1,5)) print('{} end'.format(self.name)) if __name__ == '__main__': p = MyProcess('cc') p.start() p.terminate()#关闭进程,不会立即关闭,所以这个进程可能还是活着 print('进程id:',p.pid)#查看进程pid print('进程name:',p.name) print(p.is_alive()) print('主') time.sleep(1) print(p.is_alive())
九、僵尸进程(有害)
僵尸进程:一个进程使用fork创建子进程,子进程退出后,系统仍会为其保留一定的信息(进程号、退出状态、运行时间等),
如果子进程退出,而父进程并没有调用wait或waitpid释放子进程的状态信息,
那么子进程的进程描述符仍然保存在系统中,。这种进程称之为僵死进程。
其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果存在大量的产生僵死进程,
将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。
十、孤儿进程(无害)
孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。
孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
十一、守护进程
主进程创建守护进程
其一:守护进程会在主进程代码执行结束后就终止
其二:守护进程内无法再开启子进程,否则抛出异常:
AssertionError: daemonic processes are not allowed to have children
注意:进程之间是互相独立的,主进程代码运行结束,守护进程随即终止
例1:
from multiprocessing import Process import time import random def fun(name): print('{} start '.format(name)) time.sleep(random.randint(1,5)) print('{} end'.format(name)) if __name__ == '__main__': p = Process(target=fun, args=('cc',)) p.daemon = True #在p.start()前设置p为守护进程,禁止p创建子进程,父代码执行结束则p终止运行 p.start() print('主')
例2:
#主进程代码运行完毕,守护进程就会结束 from multiprocessing import Process import time def foo(): print(123) time.sleep(1) print("end123") def bar(): print(456) time.sleep(3) print("end456") if __name__ == '__main__': p1=Process(target=foo) p2=Process(target=bar) p1.daemon=True#设p1为守护进程 p1.start() p2.start() print("main-------") #打印该行则主进程代码结束,则守护进程p1应该被终止,可能会有p1任务执行的打印信息123,因为主进程打印main----时,p1也执行了,但是随即被终止,取决于机器速度
十二、进程同步(锁)
进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,
而共享带来的是竞争,竞争带来的结果就是错乱,如何控制,就是加锁处理
例1:多个进程共享同一打印终端
from multiprocessing import Process, Lock import time, json, random, os def work(lock): lock.acquire() #加锁 print('{} is runnig'.format(os.getpid())) time.sleep(2) print('{} is done'.format(os.getpid())) lock.release() if __name__ == '__main__': lock = Lock() for i in range(3): p = Process(target=work, args=(lock,)) p.start()
例2:模拟抢票
from multiprocessing import Process, Lock import time, json, random def search(): dic = json.load(open('db.txt')) print('剩余票数:',dic['count']) def get(): dic = json.load(open('db.txt')) time.sleep(0.1) #模拟网路延迟 if dic['count'] > 0: dic['count'] -= 1 time.sleep(0.2) json.dump(dic, open('db.txt', 'w')) print('购票成功') def task(lock): search() lock.acquire()#加锁 get() lock.release() if __name__ == '__main__': lock = Lock() for i in range(10): p = Process(target=task, args=(lock, )) p.start()
加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,
即串行的修改,没错,速度是慢了,但牺牲了速度却保证了数据安全。
虽然可以用文件共享数据实现进程间通信,但问题是:
1.效率低(共享数据基于文件,而文件是硬盘上的数据)
2.需要自己加锁处理
因此我们最好找寻一种解决方案能够兼顾:
1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。
这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。
1 队列和管道都是将数据存放于内存中
2 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来,
我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性。
十三:队列
from multiprocessing import Queue p = Queue(3) p.put('1') p.put('skss') p.put(9) p.put('kk', block=False) #等于 p.put_nowait('kk') p.put(3,block=True, timeout=3) # 设置超时时间 p.get()
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 地球OL攻略 —— 某应届生求职总结
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· 提示词工程——AI应用必不可少的技术
· .NET周刊【3月第1期 2025-03-02】