python 包之 multiprocessing 多进程教程

一、创建一个进程

  • 实例化 Process 类创建一个进程对象

  • 然后调用它的 start 方法即可生成一个子进程

from multiprocessing import Process

def func(s):
  print(s)

if __name__ == '__main__':
  p = Process(target=func, args=('autofelix', ))
  p.start()
  p.join()

 

二、创建多个进程

from multiprocessing import Process

def func(s):
  print(s)

if __name__ == '__main__':
  process = [
  	Process(target=func, args=('1', ))
    Process(target=func, args=('2', ))
  ]
  
  [p.start() for p in process]
  [p.join() for p in process]

 

三、管道pipe进行进程间通信

  • Pipe(duplex=True):表示双工通信,也就是双向的,既可以接受也可以发送数据,默认为True

  • Pipe(duplex=False):表示单工通信,也就是单向的,只能进行接受或者发送数据

from multiprocessing import Process, Pipe

def func(conn):
  print('send a list object ot other side...')
  # 从管道对象的一端发送数据对象
  conn.send(['33', 44, None])
  conn.close()

if __name__ == '__main__':
  # 默认创建一个双工管道对象,返回的两个对象代表管道的两端,
  # 双工表示两端的对象都可以发送和接收数据,但是需要注意,
  # 需要避免多个进程或线程从一端同时读或写数据
  parent_conn, child_conn = Pipe()
  p = Process(target=func, args=(child_conn, ))
  p.start()
  # 从管道的另一端接收数据对象
  print(parent_conn.recv())
  p.join()

 

四、队列Queue进行进程间通信

  • 当向队列中放入的数据较大时,就会在join()处卡死

  • 为了避免这种情况,常的做法是先使用get()将数据取出来,再使用join()方法

  • 如果不这样处理,队列进程将不能正常终止,造成死锁情况

from multiprocessing import Process, Queue

def func(q):
  print('put a list object to queue...')
  # 向Queue对象中添加一个对象
  q.put(['33', 44, None])

if __name__ == '__main__':
  # 创建一个队列
  q = Queue()
  p = Process(target=func, args=(q, ))
  p.start()
  # 从Queue对象中获取一个对象
  print(q.get())
  p.join()

 

五、进程间同步

  • 使用锁保证进程间的同步操作

from multiprocessing import Process, Lock

def func(lc, num):
  # 使用锁保证以下代码同一时间只有一个进程在执行
  lc.acquire()
  print('process num: ', num)
  lc.release()

if __name__ == '__main__':
  lock = Lock()
  for i in range(5):
      Process(target=func, args=(lock, i)).start()

 

六、进程间共享数据

  • 使用共享内存的方式,共享值Value对象和数据Array对象

from multiprocessing import Process, Value, Array

def func(n, a):
  n.value = 3.333
  for i in range(len(a)):
      a[i] = -a[i]

if __name__ == '__main__':
  # 第一个参数d表示数据类型'double'双精度浮点类型
  num = Value('d', 0.0)
  # 第一个参数i表示数据类型'integer'整型
  arr = Array('i', range(6))
  p = Process(target=func, args=(num, arr))
  p.start()
  p.join()
  print(num.value)
  print(arr[:])

 

七、进程池

  • 创建一个 Pool 进程池对象,并执行提交给它的任务

  • 进程池对象允许其中的进程以不同的方式运行

  • 但是需要注意,Pool 对象的方法只能是创建它的进程才能调用

from multiprocessing import Pool
import time

def f(x):
    return x * x

if __name__ == '__main__':
    with Pool(processes=4) as pool:  # start 4 worker processes
      	# 在进程池中开启一个新的进程并执行 f 函数
        result = pool.apply_async(f, (10,))  # evaluate "f(10)" asynchronously in a single process
        print(result.get(timeout=1))  # prints "100" unless your computer is *very* slow
				
        # map会一直阻塞当前进程直到运行完可迭代对象中的所有元素,并返回结果。
        print(pool.map(f, range(10)))  # prints "[0, 1, 4,..., 81]"
				
        # imap是map方法的延迟执行版本,对于比较消耗内存的迭代,建议使用这个方法,
        it = pool.imap(f, range(10))
        print(next(it))  # prints "0"
        print(next(it))  # prints "1"
        print(it.next(timeout=1))  # prints "4" unless your computer is *very* slow

        result = pool.apply_async(time.sleep, (10,))
        print(result.get(timeout=1))  # raises multiprocessing.TimeoutError

 

posted @ 2022-03-31 12:38  sunnyeden  阅读(158)  评论(0编辑  收藏  举报