使用进程池规避Python的GIL限制

操作系统： CentOS7.3.1611_x64

python版本：2.7.5

问题描述

Python的GIL会对CPU密集型的程序产生影响，如果完全使用Python来编程，怎么避开GIL的限制呢？

解决方案

在多线程中使用进程池来规避GIL的限制。具体如下：

1、使用multiprocessing模块来创建进程池；

2、将计算任务分配给不同的线程；

3、在任务线程中把任务提交给之前创建的进程池；

每当有线程要执行cpu密集型任务时，就把该任务提交到进程池中，然后进程池会将任务交给运行在另一个进程中的Python解释器。

当线程等待结果时会释放GIL，而此时的计算任务是在另一个单独的Python解释器中执行的，不再受到GIL的限制了。

在多核系统中采用这个方案能轻易地利用到所有的CPU核心。

假设有这样的worker函数：

def worker(arr):
    s = 0
    for n in arr :
        arrTmp = range(1,n+1)
        if len(arrTmp) == 0 : continue
        rtmp = 1
        for i in arrTmp :
            rtmp *= i
        s += rtmp
    return s

完整代码如下：https://github.com/mike-zhang/pyExamples/blob/master/gilAvoid/gilAvoidTest1/taskCommon.py

普通单进程任务实现：

def main():
    s = 0
    tStart,tStop = 1,1000
    for i in range(1,100):
        #t = worker(range(tStart,tStop))
        t = worker(range(1,1000))
        s += t
        tStart = tStop
        tStop += 1000
    print("len : ",len(str(s)))
    print(s%10000)

完整代码如下： https://github.com/mike-zhang/pyExamples/blob/master/gilAvoid/gilAvoidTest1/t1_normal.py

运行效果如下：

(py27env) [mike@localhost test]$ time python t1_normal.py
('len : ', 2567)
987

real    0m17.919s
user    0m17.915s
sys     0m0.003s

使用进程池的实现：

def wokerThread(start,stop):
    #r = gPool.apply(worker,(range(start,stop),))
    r = gPool.apply(worker,(range(1,1000),))
    q.put(r)
# E-Mail : Mike_Zhang@live.com
def main():
    s = 0
    thrdArr = []
    tStart,tStop = 1,1000
    for i in range(1,gCount+1):
        thrd = threading.Thread(target=wokerThread,args=(tStart,tStop))
        thrdArr.append(thrd)
        tStart = tStop
        tStop += 1000
    for t in thrdArr :
        t.daemon = True
        t.start()
    while not q.full(): time.sleep(0.1)
    while not q.empty(): s += q.get()
    print("len : ",len(str(s)))
    print(s%10000)

完整代码如下：https://github.com/mike-zhang/pyExamples/blob/master/gilAvoid/gilAvoidTest1/t2_mp.py

运行效果如下：

(py27env) [mike@localhost test]$ time python t2_mp.py
queue full
('len : ', 2567)
987

real    0m4.917s
user    0m18.356s
sys     0m0.146s

可以看出使用上述方法可以规避GIL的限制（测试机器为i5 4核），程序的速度得到明显的提升。

好，就这些了，希望对你有帮助。

本文github地址：

https://github.com/mike-zhang/mikeBlogEssays/blob/master/2017/20170819_使用进程池规避python的GIL限制.rst

欢迎补充

posted on 2017-08-19 23:17 Mike_Zhang 阅读(1493) 评论(0) 编辑收藏举报