02进程

内容均参考https://www.cnblogs.com/linhaifeng/p/7278389.html，https://www.cnblogs.com/xiaoyuanqujing/p/11636160.html，感谢分享

一、进程的概念
进程是资源分配和调度的基本单位，进程是程序在处理器上的一次执行过程，进程是能独立运行的基本单位。
进程是动态的，程序是静止的，进程是程序的执行。
进程的三种基本状态：
就绪态、执行态、阻塞态

二、进程的组成
进程是由程序控制块（PCB）、程序段、数据段组成。
操作系统是通过PCB来管理进程，因此PCB中应该包含操作系统对其进行管理所需的各种信息，
如进程描述信息、进程控制和管理信息、资源分配清单和处理机相关信息。
程序段：程序代码存放的位置。
数据段：程序运行时使用、产生的运算数据。如全局变量、局部变量、宏定义的常量就存放在数据段内。

三、 multiprocessing模块
python中的多线程无法利用多核优势，如果想要充分地使用多核CPU的资源（os.cpu_count()查看），
在python中大部分情况需要使用多进程。Python提供了multiprocessing。
multiprocessing模块用来开启子进程，并在子进程中执行我们定制的任务（比如函数），
该模块与多线程模块threading的编程接口类似。

multiprocessing模块的功能众多：支持子进程、通信和共享数据、执行不同形式的同步，
提供了Process、Queue、Pipe、Lock等组件。

四、Process类
Process([group [, target [, name [, args [, kwargs]]]]])，由该类实例化得到的对象，表示一个子进程中的任务
强调：
1. 需要使用关键字的方式来指定参数
2. args指定的为传给target函数的位置参数，是一个元组形式，必须有逗号
参数介绍：
group参数未使用，值始终为None
target表示调用对象，即子进程要执行的任务
args表示调用对象的位置参数元组，args=(1,2,'egon',)
kwargs表示调用对象的字典,kwargs={'name':'egon','age':18}
name为子进程的名称

方法介绍：
p.start()：启动进程，并调用该子进程中的p.run()
p.run():进程启动时运行的方法，正是它去调用target指定的函数，我们自定义类的类中一定要实现该方法
p.terminate():强制终止进程p，不会进行任何清理操作，如果p创建了子进程，该子进程就成了僵尸进程，
使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放，进而导致死锁
p.is_alive():如果p仍然运行，返回True
p.join([timeout]):主线程等待p终止后才运行（强调：是主线程处于等的状态，而p是处于运行的状态）。
timeout是可选的超时时间，需要强调的是，p.join只能join住start开启的进程，而不能join住run开启的进程

属性介绍：
p.daemon：默认值为False，如果设为True，代表p为后台运行的守护进程，
当p的父进程终止时，p也随之终止，并且设定为True后，p不能创建自己的新进程，必须在p.start()之前设置
p.name:进程的名称
p.pid：进程的pid
p.exitcode:进程在运行时为None、如果为–N，表示被信号N结束(了解即可)
p.authkey:进程的身份验证键,默认是由os.urandom()随机生成的32字符的字符串。
这个键的用途是为涉及网络连接的底层进程间通信提供安全性，
这类连接只有在具有相同的身份验证键时才能成功（了解即可）

在windows中Process()必须放到# if __name__ == '__main__':下。

五、进程的创建

（1）方法一

import time
import random
from multiprocessing import Process
def fun(name):
    print('{} start '.format(name))
    time.sleep(random.randint(1,5))
    print('{} end'.format(name))

if __name__ == '__main__':
    p1 = Process(target=fun, args=('cc',))
    p2 = Process(target=fun, args=('dd',))
    p3 = Process(target=fun, args=('ee',))

    p1.start()
    p2.start()
    p3.start()

    print('主')

（2）方法二，构建自己的类，重写run()

import time
import random
from multiprocessing import Process

class MyProcess(Process):
    def __init__(self, name):
        super().__init__()#调用父类构造方法
        self.name = name
    def run(self):
        print('{} start '.format(self.name))
        time.sleep(random.randint(1,5))
        print('{} end'.format(self.name))

if __name__ == '__main__':
    p1 = MyProcess('cc')
    p2 = MyProcess('dd')
    p3 = MyProcess('ee')

    p1.start()#start()会自动调用run()
    p2.start()
    p3.start()

    print('主')

六、进程的内存空间是隔离的

from multiprocessing import Process
n = 100
def fun():
    global n
    n = 0
    print('子进程内：',n) #子进程内： 0

if __name__ == '__main__':
    p = Process(target=fun)
    p.start()
    print('主进程内：', n)#主进程内： 100

七、join():主线程等待子线程终止

# p.join只能join住start开启的进程，而不能join住run开启的进程
from multiprocessing import Process
import time
import random

def fun(name):
    print('{} start '.format(name))
    time.sleep(random.randint(1,5))
    print('{} end'.format(name))

if __name__ == '__main__':
    p = Process(target=fun, args=('cc',))
    p.start()
    p.join()#主线程等待子线程终止后才会运行
    print('主')

八、Process对象的其他方法或属性

# (1)terminate、name、pid
from multiprocessing import Process
import time
import random

class MyProcess(Process):
    def __init__(self, name):
        super().__init__()
        self.name = name #为开启的进程设置名字

    def run(self):
        print('{} start '.format(self.name))
        time.sleep(random.randint(1,5))
        print('{} end'.format(self.name))

if __name__ == '__main__':
    p = MyProcess('cc')
    p.start()

    p.terminate()#关闭进程，不会立即关闭，所以这个进程可能还是活着
    print('进程id:',p.pid)#查看进程pid
    print('进程name:',p.name)
    print(p.is_alive())

    print('主')
    time.sleep(1)
    print(p.is_alive())

九、僵尸进程（有害）
僵尸进程：一个进程使用fork创建子进程，子进程退出后，系统仍会为其保留一定的信息（进程号、退出状态、运行时间等），
如果子进程退出，而父进程并没有调用wait或waitpid释放子进程的状态信息，
那么子进程的进程描述符仍然保存在系统中，。这种进程称之为僵死进程。
其进程号就会一直被占用，但是系统所能使用的进程号是有限的，如果存在大量的产生僵死进程，
将因为没有可用的进程号而导致系统不能产生新的进程. 此即为僵尸进程的危害，应当避免。

十、孤儿进程（无害）
孤儿进程：一个父进程退出，而它的一个或多个子进程还在运行，那么那些子进程将成为孤儿进程。
孤儿进程将被init进程(进程号为1)所收养，并由init进程对它们完成状态收集工作。

十一、守护进程

主进程创建守护进程
　　其一：守护进程会在主进程代码执行结束后就终止
　　其二：守护进程内无法再开启子进程,否则抛出异常：
      AssertionError: daemonic processes are not allowed to have children

注意：进程之间是互相独立的，主进程代码运行结束，守护进程随即终止

例1：

from multiprocessing import Process
import time
import random

def fun(name):
    print('{} start '.format(name))
    time.sleep(random.randint(1,5))
    print('{} end'.format(name))

if __name__ == '__main__':
    p = Process(target=fun, args=('cc',))
    p.daemon = True #在p.start()前设置p为守护进程，禁止p创建子进程，父代码执行结束则p终止运行
    p.start()
    print('主')

例2：

#主进程代码运行完毕,守护进程就会结束
from multiprocessing import Process
import time
def foo():
    print(123)
    time.sleep(1)
    print("end123")

def bar():
    print(456)
    time.sleep(3)
    print("end456")

if __name__ == '__main__':

    p1=Process(target=foo)
    p2=Process(target=bar)

    p1.daemon=True#设p1为守护进程
    p1.start()
    p2.start()
    print("main-------") #打印该行则主进程代码结束,则守护进程p1应该被终止,可能会有p1任务执行的打印信息123,因为主进程打印main----时,p1也执行了,但是随即被终止，取决于机器速度

十二、进程同步（锁）

进程之间数据不共享,但是共享同一套文件系统,所以访问同一个文件,或同一个打印终端,是没有问题的,
而共享带来的是竞争，竞争带来的结果就是错乱，如何控制，就是加锁处理

例1：多个进程共享同一打印终端

from multiprocessing import Process, Lock
import time, json, random, os

def work(lock):
    lock.acquire() #加锁
    print('{} is runnig'.format(os.getpid()))
    time.sleep(2)
    print('{} is done'.format(os.getpid()))
    lock.release()

if __name__ == '__main__':
    lock = Lock()
    for i in range(3):
        p = Process(target=work, args=(lock,))
        p.start()

例2:模拟抢票

from multiprocessing import Process, Lock
import time, json, random

def search():
    dic = json.load(open('db.txt'))
    print('剩余票数：',dic['count'])

def get():
    dic = json.load(open('db.txt'))
    time.sleep(0.1) #模拟网路延迟
    if dic['count'] > 0:
        dic['count'] -= 1
        time.sleep(0.2)
        json.dump(dic, open('db.txt', 'w'))
        print('购票成功')

def task(lock):
    search()
    lock.acquire()#加锁
    get()
    lock.release()

if __name__ == '__main__':
    lock = Lock()
    for i in range(10):
        p = Process(target=task, args=(lock, ))
        p.start()

加锁可以保证多个进程修改同一块数据时，同一时间只能有一个任务可以进行修改，
即串行的修改，没错，速度是慢了，但牺牲了速度却保证了数据安全。
虽然可以用文件共享数据实现进程间通信，但问题是：
1.效率低（共享数据基于文件，而文件是硬盘上的数据）
2.需要自己加锁处理

因此我们最好找寻一种解决方案能够兼顾：
1、效率高（多个进程共享一块内存的数据）2、帮我们处理好锁问题。
这就是mutiprocessing模块为我们提供的基于消息的IPC通信机制：队列和管道。
1 队列和管道都是将数据存放于内存中
2 队列又是基于（管道+锁）实现的，可以让我们从复杂的锁问题中解脱出来，
我们应该尽量避免使用共享数据，尽可能使用消息传递和队列，避免处理复杂的同步和锁问题，而且在进程数目增多时，往往可以获得更好的可获展性。

十三：队列

from multiprocessing import Queue

p = Queue(3)

p.put('1')
p.put('skss')
p.put(9)
p.put('kk', block=False) #等于 p.put_nowait('kk')
p.put(3,block=True, timeout=3) # 设置超时时间

p.get()

posted @ 2021-03-01 09:33 cheng4632 阅读(160) 评论(0) 收藏举报

刷新页面返回顶部