02进程

内容均参考https://www.cnblogs.com/linhaifeng/p/7278389.html,https://www.cnblogs.com/xiaoyuanqujing/p/11636160.html,感谢分享

一、进程的概念

进程是资源分配和调度的基本单位,进程是程序在处理器上的一次执行过程,进程是能独立运行的基本单位。
进程是动态的,程序是静止的,进程是程序的执行。
进程的三种基本状态:
就绪态、执行态、阻塞态

二、进程的组成
进程是由程序控制块(PCB)、程序段、数据段组成。
操作系统是通过PCB来管理进程,因此PCB中应该包含操作系统对其进行管理所需的各种信息,
如进程描述信息、进程控制和管理信息、资源分配清单和处理机相关信息。
程序段:程序代码存放的位置。
数据段:程序运行时使用、产生的运算数据。如全局变量、局部变量、宏定义的常量就存放在数据段内。

三、 multiprocessing模块
python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),
在python中大部分情况需要使用多进程。Python提供了multiprocessing。
multiprocessing模块用来开启子进程,并在子进程中执行我们定制的任务(比如函数),
该模块与多线程模块threading的编程接口类似。

multiprocessing模块的功能众多:支持子进程、通信和共享数据、执行不同形式的同步,
提供了Process、Queue、Pipe、Lock等组件。

四、Process类
Process([group [, target [, name [, args [, kwargs]]]]]),由该类实例化得到的对象,表示一个子进程中的任务
强调:
1. 需要使用关键字的方式来指定参数
2. args指定的为传给target函数的位置参数,是一个元组形式,必须有逗号
参数介绍:
group参数未使用,值始终为None
target表示调用对象,即子进程要执行的任务
args表示调用对象的位置参数元组,args=(1,2,'egon',)
kwargs表示调用对象的字典,kwargs={'name':'egon','age':18}
name为子进程的名称

方法介绍:
p.start():启动进程,并调用该子进程中的p.run()
p.run():进程启动时运行的方法,正是它去调用target指定的函数,我们自定义类的类中一定要实现该方法
p.terminate():强制终止进程p,不会进行任何清理操作,如果p创建了子进程,该子进程就成了僵尸进程,
使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放,进而导致死锁
p.is_alive():如果p仍然运行,返回True
p.join([timeout]):主线程等待p终止后才运行(强调:是主线程处于等的状态,而p是处于运行的状态)。
timeout是可选的超时时间,需要强调的是,p.join只能join住start开启的进程,而不能join住run开启的进程

属性介绍:
p.daemon:默认值为False,如果设为True,代表p为后台运行的守护进程,
当p的父进程终止时,p也随之终止,并且设定为True后,p不能创建自己的新进程,必须在p.start()之前设置
p.name:进程的名称
p.pid:进程的pid
p.exitcode:进程在运行时为None、如果为–N,表示被信号N结束(了解即可)
p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。
这个键的用途是为涉及网络连接的底层进程间通信提供安全性,
这类连接只有在具有相同的身份验证键时才能成功(了解即可)

在windows中Process()必须放到# if __name__ == '__main__':下。

五、进程的创建
(1)方法一
import time
import random
from multiprocessing import Process
def fun(name):
    print('{} start '.format(name))
    time.sleep(random.randint(1,5))
    print('{} end'.format(name))

if __name__ == '__main__':
    p1 = Process(target=fun, args=('cc',))
    p2 = Process(target=fun, args=('dd',))
    p3 = Process(target=fun, args=('ee',))

    p1.start()
    p2.start()
    p3.start()

    print('')

 (2)方法二,构建自己的类,重写run()

import time
import random
from multiprocessing import Process

class MyProcess(Process):
    def __init__(self, name):
        super().__init__()#调用父类构造方法
        self.name = name
    def run(self):
        print('{} start '.format(self.name))
        time.sleep(random.randint(1,5))
        print('{} end'.format(self.name))

if __name__ == '__main__':
    p1 = MyProcess('cc')
    p2 = MyProcess('dd')
    p3 = MyProcess('ee')

    p1.start()#start()会自动调用run()
    p2.start()
    p3.start()

    print('')
六、进程的内存空间是隔离的
from multiprocessing import Process
n = 100
def fun():
    global n
    n = 0
    print('子进程内:',n) #子进程内: 0

if __name__ == '__main__':
    p = Process(target=fun)
    p.start()
    print('主进程内:', n)#主进程内: 100
七、join():主线程等待子线程终止 
# p.join只能join住start开启的进程,而不能join住run开启的进程
from multiprocessing import Process
import time
import random

def fun(name):
    print('{} start '.format(name))
    time.sleep(random.randint(1,5))
    print('{} end'.format(name))

if __name__ == '__main__':
    p = Process(target=fun, args=('cc',))
    p.start()
    p.join()#主线程等待子线程终止后才会运行
    print('')

 八、Process对象的其他方法或属性

# (1)terminate、name、pid
from multiprocessing import Process
import time
import random

class MyProcess(Process):
    def __init__(self, name):
        super().__init__()
        self.name = name #为开启的进程设置名字

    def run(self):
        print('{} start '.format(self.name))
        time.sleep(random.randint(1,5))
        print('{} end'.format(self.name))

if __name__ == '__main__':
    p = MyProcess('cc')
    p.start()

    p.terminate()#关闭进程,不会立即关闭,所以这个进程可能还是活着
    print('进程id:',p.pid)#查看进程pid
    print('进程name:',p.name)
    print(p.is_alive())

    print('')
    time.sleep(1)
    print(p.is_alive())
九、僵尸进程(有害)
僵尸进程:一个进程使用fork创建子进程,子进程退出后,系统仍会为其保留一定的信息(进程号、退出状态、运行时间等),
如果子进程退出,而父进程并没有调用wait或waitpid释放子进程的状态信息,
那么子进程的进程描述符仍然保存在系统中,。这种进程称之为僵死进程。
其进程号就会一直被占用,但是系统所能使用的进程号是有限的,如果存在大量的产生僵死进程,
将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害,应当避免。

十、孤儿进程(无害)
孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。
孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
十一、守护进程
主进程创建守护进程
  其一:守护进程会在主进程代码执行结束后就终止
  其二:守护进程内无法再开启子进程,否则抛出异常:
AssertionError: daemonic processes are not allowed to have children

注意:进程之间是互相独立的,主进程代码运行结束,守护进程随即终止

例1:
from multiprocessing import Process
import time
import random

def fun(name):
    print('{} start '.format(name))
    time.sleep(random.randint(1,5))
    print('{} end'.format(name))

if __name__ == '__main__':
    p = Process(target=fun, args=('cc',))
    p.daemon = True #在p.start()前设置p为守护进程,禁止p创建子进程,父代码执行结束则p终止运行
    p.start()
    print('')

 例2:

#主进程代码运行完毕,守护进程就会结束
from multiprocessing import Process
import time
def foo():
    print(123)
    time.sleep(1)
    print("end123")

def bar():
    print(456)
    time.sleep(3)
    print("end456")

if __name__ == '__main__':

    p1=Process(target=foo)
    p2=Process(target=bar)

    p1.daemon=True#设p1为守护进程
    p1.start()
    p2.start()
    print("main-------") #打印该行则主进程代码结束,则守护进程p1应该被终止,可能会有p1任务执行的打印信息123,因为主进程打印main----时,p1也执行了,但是随即被终止,取决于机器速度
十二、进程同步(锁)

进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,
而共享带来的是竞争,竞争带来的结果就是错乱,如何控制,就是加锁处理

例1:多个进程共享同一打印终端
from multiprocessing import Process, Lock
import time, json, random, os

def work(lock):
    lock.acquire() #加锁
    print('{} is runnig'.format(os.getpid()))
    time.sleep(2)
    print('{} is done'.format(os.getpid()))
    lock.release()

if __name__ == '__main__':
    lock = Lock()
    for i in range(3):
        p = Process(target=work, args=(lock,))
        p.start()

 例2:模拟抢票

from multiprocessing import Process, Lock
import time, json, random

def search():
    dic = json.load(open('db.txt'))
    print('剩余票数:',dic['count'])

def get():
    dic = json.load(open('db.txt'))
    time.sleep(0.1) #模拟网路延迟
    if dic['count'] > 0:
        dic['count'] -= 1
        time.sleep(0.2)
        json.dump(dic, open('db.txt', 'w'))
        print('购票成功')

def task(lock):
    search()
    lock.acquire()#加锁
    get()
    lock.release()

if __name__ == '__main__':
    lock = Lock()
    for i in range(10):
        p = Process(target=task, args=(lock, ))
        p.start()
加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,
即串行的修改,没错,速度是慢了,但牺牲了速度却保证了数据安全。
虽然可以用文件共享数据实现进程间通信,但问题是:
1.效率低(共享数据基于文件,而文件是硬盘上的数据)
2.需要自己加锁处理

因此我们最好找寻一种解决方案能够兼顾:
1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。
这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。
1 队列和管道都是将数据存放于内存中
2 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来,
我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性。
十三:队列
from multiprocessing import Queue

p = Queue(3)

p.put('1')
p.put('skss')
p.put(9)
p.put('kk', block=False) #等于 p.put_nowait('kk')
p.put(3,block=True, timeout=3) # 设置超时时间

p.get()

 

posted @ 2021-03-01 09:33  cheng4632  阅读(142)  评论(0编辑  收藏  举报