python3.x Day6 多进程

多进程：
1、每个子进程申请到的资源都是独立的，不与其他进程共享。
2、语法上和线程基本上差不多，使用multiprocessing.Process(target=xxxx,args=(xxx,xxx,xxx,))创建子进程。
3、包含的方法，与线程的也差不多
4、配合os.getpid()方法取得当前进程ID，配合os.getppid()方法取得当前进程的父进程ID

多进程之间的通信：
消息传递：
import queue这个队列模块，是线程queue，只能作用于当前进程，子进程已经不在当前进程中了，所以这个模块就不适用了。

可以使用进程Queue来搞定，进程Queue，q=multiprocessing.Queue()，语法上和线程queue（import queue）差不多的。
使用时，一定要传给子进程运行的函数，线程的queue这个问题还好，但线程queue是无法传递给子进程的，
说白了，进程queue就干进程的事，线程queue就干线程的事，完全不能混用，编写代码必须注意

进程queue原理：进程queue不是共享数据，而是每个进程一个queue，克隆的，还有个不在任何进程内的中间件从A进程来序列化这个queue，
再反序列化这个queue给B进程，来完成数据的传递，这里修改的，不是同一份数据。


还可以使用Pipe管道实现，paraent_pp,child_pp=multiprocessing.Pipe(),会返回一个通道的两端，父进程端，子进程端，没有差异，标识好，
便于写代码时使用，通讯是paraent_pp.send()，对应一个child_pp.recv() 一个发送对应一个回收，底层是socket本机通讯实现的。

数据共享：
以下必须在__name__=="__main__"的情况下运行，也就是作为主进程运行时才可以创建。
mmm= multiprocessing.Manager()  # 这个必须是在主进程执行，所以__name__=="__main__"才能使用，
        # 共享数据用的对象，
        # 可以生成共享的相应对象：
        # list, dict, Namespace, Lock, RLock, Semaphore,
        # BoundedSemaphore, Condition, Event, Barrier, Queue, Value ,Array
    md = mmm.dict() #生成共享字典
    ml = mmm.list() #生成共享列表
    ml.append("[%s]主进程加的"%os.getpid()) #主进程向共享列表中修改数据
    md[os.getpid()]="[%s]主进程加的"%os.getpid() #主进程向共享字典中修改数据

共享资源必须传递给子进程，子进程才可以使用。


进程锁：使用multiprocessing.Lock()，用法和线程锁一致，但是其实实际意义不大，因为进程本来就是资源独立，不存在资源征用，
但是，屏幕是共享的，保证输出完整，用这个锁是ok的



重点：进程池使用multiprocessing.Pool
声明 pool=multiprocessing.Pool(processes=2)  #定义一个进程池，每次执行两个进程的进程池
使用：
    for i in range(20):
        # pool.apply(func=go_process,args=(i,))     #进程池中开始执行进程，这个是串行执行，不支持回调函数
        pool.apply_async(func=go_process,args=(i,),callback=go_back)    #一般用这个，就是并行执行定义时定义的并行进程个数，支持回调函数
关闭：
    pool.close()    #先写关闭进程池
    pool.join()     #再写等待子进程完成，必须这个顺序，原因不明

import multiprocessing #多进程模块
import time,os

os.getpid() #获取当前进程的进程ID
os.getppid() #获取当前进程的父进程ID

qq=multiprocessing.Queue() #这是个进程queue，语法与线程queue （import queue的那个）是一样的。实现进程间的通信

p_pp,c_pp=multiprocessing.Pipe() #用于进城之间通信的另一个方式，管道，生成了管道的两端，没有区别，父进程一个，子进程一个






def run(dict,llll,pp,qq_func,name):
    dict[os.getpid()]="[%s]子进程加的"%os.getpid()  #子进程向共享字典中修改数据
    llll.append("[%s]子进程加的"%os.getpid()) #子进程向共享列表中修改数据
    qq_func.put("队列数据：子进程ID[%s]"%os.getpid()) #子进程向共享队列中修改数据
    print("我是子进程，我的进程ID：",os.getpid())
    print("那么我的父进程ID是：",os.getppid())
    pp.send("这是子进程[%s]通过pipe发过来的信息"%os.getpid()) #子进程向进程通讯管道中发送数据
    time.sleep(2)
    print("i'm %s"%name)


if __name__=="__main__":
    p_list=[]
    mmm= multiprocessing.Manager()  # 这个必须是在主进程执行，所以__name__=="__main__"才能使用，
        # 共享数据用的对象，
        # 可以生成共享的相应对象：
        # list, dict, Namespace, Lock, RLock, Semaphore,
        # BoundedSemaphore, Condition, Event, Barrier, Queue, Value ,Array
    md = mmm.dict() #生成共享字典
    ml = mmm.list() #生成共享列表
    ml.append("[%s]主进程加的"%os.getpid()) #主进程向共享列表中修改数据
    md[os.getpid()]="[%s]主进程加的"%os.getpid() #主进程向共享字典中修改数据
    for i in range(10):
        p=multiprocessing.Process(target=run,args=(md,ml,c_pp,qq,"kk[%s]"%i,)) #与多线程语法差不多，这样就生成了进程实例，
        p.start()  #启动子进程
        p_list.append(p)


    print("我是主进程，我的进程ID：", os.getpid())

    for mp in p_list:
        mp.join()
    print(md) #显示共享字典最终数据
    print(ml) #显示共享列表最终数据
    i=0
    while i<len(p_list):
        print(qq.get())
        print(p_pp.recv())  #主进程从进程通道中获取数据
        i+=1



    print(qq.qsize())

进程池：

def go_process(m):  #子进程执行的函数
    time.sleep(2)
    print("参数：[%s]，子进程的pid：%s"%(m,os.getpid()))

def go_back(m):     #回调函数
    print("这是回调函数，参数[%s]执行的进程是：%s"%(m,os.getpid()))



if __name__=="__main__":
    pool=multiprocessing.Pool(processes=2)  #定义一个进程池，每次执行两个进程的进程池

    for i in range(20):
        # pool.apply(func=go_process,args=(i,))     #进程池中开始执行进程，这个是串行执行，不支持回调函数
        pool.apply_async(func=go_process,args=(i,),callback=go_back)    #一般用这个，就是并行执行定义时定义的并行进程个数，支持回调函数

    pool.close()    #先写关闭进程池
    pool.join()     #再写等待子进程完成，必须这个顺序，原因不明

posted @ 2017-12-20 15:05 王玥阅读(234) 评论(0) 编辑收藏举报

刷新页面返回顶部

王玥

python3.x Day6 多进程

公告