Python-进程-进程池-原理

 

 进程

  资源集合,调度和分配资源,说到进程就不得不提到线程,线程和进程是密不可分,进程申请了资源,但真正使用资源的是线程,其实本质上类似面向对象的思想,面向对象把数据和数据的操作封装在一个类中,进程把资源和对资源的操作封装在进程中,其实进程本质上是对资源的封装,那就比对进程和线程的区别来认识进程:

  1. 进程是资源容器,真正使用资源的是线程,进程可以申请并拥有自己独立资源但线程不能,线程只能使用进程已有的资源

  2. 进程在CPU上执行体现在线程,一个进程至少有一个主线程,可以有0个或者多个子线程

  3. 从粒度角度看,进程粒度远远比线程大,进程粒度比线程小,也就是切换进程消耗远比线程切换大

  4. 线程是操作系统调度的最小单位,对于IO操作进程和线程差别不大,进程和线程都可以竞争CPU资源,归根到本质上是线程在竞争CPU资源

  5. 进程与进程之间是资源完全隔离,也就是说不可互相访问

北门吹雪: http://www.cnblogs.com/2bjiujiu/

 

Python进程模块  multiprocessing

  # 这个模块的接口和线程模块threading一致

 

多进程实例过程:

  1. 实例进程

  2. 启动子进程

  3. 等待子进程结束

import multiprocessing


def add(end, name):
    total = 0
    for i in range(end+1):
        total += i
    print(name)
    return total


if __name__ == '__main__':
    # 实例子进程
    ps = multiprocessing.Process(target=add, args=(100, "北门吹雪"), name="北门吹雪")
    # 启动子进程
    ps.start()
    # 等待子进程结束
    ps.join()

  

进程池      Pool

  # 接口和线程池一致,可以获取进程状态,如子进程执行结果、否准备、是否执行成功、等待子进程执行完成

  1. 实例进程池,需要传递进程池数量

  2. 添加子进程到进程池中

  3. 先关闭Pool,禁止进程池再接收任务

  4. 等待进程池中进程完成

  6. 关闭进程池

import multiprocessing


def add(end, name, blog):
    total = 0
    for i in range(end+1):
        total += i
    print(name, total, blog)
    return total


if __name__ == '__main__':
    # 实例子进程,和CPU数量一致
    ps_pool = multiprocessing.Pool(multiprocessing.cpu_count())
    # 提交任务,获得返回进程对象对象, 可在此提交多个进程
    r = ps_pool.apply_async(func=add, args=(100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"))
    # 获取执行结果,状态信息
    print(r.get())
    # print(r.wait())
    print(r.ready())
    print(r.successful())
    # 关闭线程池
    ps_pool.close()
    # 等待子线程完成
    ps_pool.join()

  7. 进程池获取子进程状态

     执行结果    .get

     是否就绪    .ready

     是否执行成功  .successful

     等待子进程   .wait

  8. 进程池imap方法, 特点是进程函数名不变,改变的传递进去的参数,结果是进程返回的结果,有先后顺序

import multiprocessing


def add(info):
    end = info[0]
    name = info[1]
    blog = info[2]
    total = 0
    for i in range(end+1):
        total += i
    print(end, name, blog)
    return total


if __name__ == '__main__':
    # 实例子进程,和CPU数量一致
    ps_pool = multiprocessing.Pool(multiprocessing.cpu_count())

    # imap方式
    info = [(100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), (200, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/")]
    # imap方式
    for total in ps_pool.imap(add, info):
        print(total)

 北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/ 

 

进程之间通信机制

  # 本质上是通过共享内存块实现通信

  1. 多进程Queue

import multiprocessing


def add(ps_queue, end, name, blog):
    total = 0
    for i in range(end+1):
        total += i
    print(name, blog)
    ps_queue.put(total)


if __name__ == '__main__':
    # 实例队列
    ps_queue = multiprocessing.Queue()
    # 实例子进程
    ps = multiprocessing.Process(target=add, args=(ps_queue, 100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), name="北门吹雪")
    # 启动子进程
    ps.start()
    # 等待子进程结束
    ps.join()
    # 从Queue中取值
    print(ps_queue.get())

  2. 管道  Pipe,只适于两个进程中通信,性能优于Queue

import multiprocessing


def add(phone_one, end, name, blog):
    total = 0
    for i in range(end+1):
        total += i
    print(name, blog)
    # 发送数据,当然也可以接收
    phone_one.send(total)


if __name__ == '__main__':
    # 实例管道, 类似打电话
    phone_one, phone_two = multiprocessing.Pipe()
    
    # 实例子进程
    ps = multiprocessing.Process(target=add, args=(phone_one, 100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), name="北门吹雪")
    # 启动子进程
    ps.start()
    # 等待子进程结束
    ps.join()
    
    # Pipe中取值
    print(phone_two.recv())

  3. 共享内存  Manager 包含Python基本数据结构 

import multiprocessing
from multiprocessing import Manager


def add(share_list, end, name, blog):
    total = 0
    for i in range(end+1):
        total += i
    print(name, blog)
    # 添加数据
    share_list.append(total)
    share_list.append(name)
    share_list.append(blog)


if __name__ == '__main__':
    # 实例共享内存对象
    share_memory = multiprocessing.Manager()
    # 实例list数据类型,当然除了list包括Python基本数据结构
    share_list = share_memory.list()

    # 实例子进程
    ps = multiprocessing.Process(target=add, args=(share_list, 100, "北门吹雪", "https://www.cnblogs.com/2bjiujiu/"), name="北门吹雪")
    # 启动子进程
    ps.start()
    # 等待子进程结束
    ps.join()

    # 从共享对象中取值
    print(share_list)

 北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/  

 

计算机资源:

  1. 内存、磁盘、CPU、网卡这4个是计算机核心资源

  2. 资源是稀缺的,需要竞争计算机资源

  3. 进程操作系统调度分配资源的单位,每个应用至少有一个进程

  4. 进程是竞争计算机资源的单位,CPU可以在不同的应用程序中切换,这个时间非常短暂,宏观上是并行,这个理念在在单核上,多核CPU可以并行执行多个进程

  5. 进程调度最核心的功能,操作系统会有自己算法,决定进程是否挂起,进程和线程的切换开销非常大,将CPU资源消耗在进程和线程切换上,时间片,频繁切换和保存进程上下文消耗CPU资源

 北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/

 

经验:

  1. 进程和线程都能竞争CPU资源,并且线程包含在进程中,同时存在又同时消亡(这里说主进程和主线程),进程和线程边界不清晰,这让进程和线程概念更加难以理清

  2. 进程和线程在逻辑上由非常多的相似点,如实例方式、启动方式、堵塞方式、池的概念、锁的概念,线程更像缩小版进程,但不是进程,包含在进程中只能使用进程分配已经有的资源

  3. 进程与进程之间资源隔离,不可互相访问,线程之间只能访问各自进程中的资源,并不是广义上的可以互相访问资源

  4. 进程用面向对象的语义来说,把资源和对资源的操作封装在一个进程中

  5. 进程切换消耗远大于线程,但为何还是需要进程,因为进程很像静态资源,使用静态资源效率上远比动态资源来的效率高,一般进程数量和CPU总核心数一致,但还是需要考虑安全冗余,不要把所有CPU跑满

 北_门_吹_雪:http://www.cnblogs.com/2bjiujiu/

posted @ 2018-06-08 16:09  梦_鱼  阅读(2513)  评论(0编辑  收藏  举报