GIL全局解释器锁及协程

GIL全局解释器锁

1、什么是GIL全局解释器锁

GIL本质是一把互斥锁,相当于执行权限,每个进程内都会存在一把GIL同一进程内的多线程,必须抢到GIL之后才能使用Cpython解释器来执行自己的代码,即同一进程下的多个线程无法实现并行,但可以实现并发

Cpython解释器下想实现并行可以开启多个进程

2、为何要有GIL

因为Cpython解释器的垃圾回收机制不是线程安全的,保证了数据的安全

3、GIL全局解释器的优缺点

优点:保证了数据安全

缺点:单个进程下开启多个线程只能实现并发不能实现并行

4、选择多进程还是多线程?

单核或多核I/O密集型下使用:多线程

单核计算密集型下使用:多线程

多核计算密集型下使用:多进程

多cpu,意味着可以有多个核并行完成计算,所以多核提升的是计算性能

每个cpu一旦遇到I/O阻塞,仍然需要等待,所以多核对I/O操作没什么用处

对于一个程序来说不可能是纯IO型或者纯计算型,我们只能相对的判断是IO密集型还是计算密集型,来选择多进程还是多线程

单核情况下:

​ 开启四个任务是计算密集型的,没有多核来并行计算,开多个进程,只是徒增进程的开销内存资源,应该使用多线程

​ 开启四个任务是IO密集型的,开启多进程也是徒增,来回切换的速度还不如开启多线程的,所以应该使用多线程

多核情况下:

​ 开启四个任务是计算密集型的,多核意味着多个CPU去计算,开启多进程可以同一时刻去计算,所以应该使用多进程

​ 开启四个任务是IO密集型的,再多的核也在在等待,来回切换的速度进程不如线程的,所以应该使用多线程

5、多线程多进程多核下性能测试

from multiprocessing import Process
from threading import Thread
import os
import time


# 计算密集型
def task1():
    i = 0
    for line in range(110000000):
        i += 1

if __name__ == '__main__':
    print(os.cpu_count())  # 查看计算机几核的
    list1 = []
    start_time = time.time()
    for i in range(4):
        p1 = Process(target=task1)  # 4进程下: 17.369488954544067 
        # t1 = Thread(target=task1) # 4线程下: 27.991361618041992
        p1.start()
        # t1.start()
        # list1.append(t1)
        list1.append(p1)
    for i in list1:
        i.join()
    end_time = time.time()
    print(end_time - start_time)


# IO密集型
def task2():
    time.sleep(1)

if __name__ == '__main__':
    print(os.cpu_count())
    start_time = time.time()
    list2 = []
    for i in range(40):
        # p2 = Process(target=task2) #40进程下: 11.374541282653809
        t2 = Thread(target=task2)  # 40线程下: 1.010239839553833
        # p2.start()
        t2.start()
        # list2.append(p2)
        list2.append(t2)
    for i in list2:
        i.join()
    end_time = time.time()
    print(end_time - start_time)

协程

1、什么是协程

进程:资源单位

线程:执行单位

协程:单线程下实现并发

在I/O密集型的情况下,使用协程提高执行效率

手动的实现在同一线程下 “ 遇到I/O切换+保存状态 ” 让操作系统误以为没有I/O操作,将CPU执行权限继续交给你

即:在单线程下实现多个任务遇到IO就切换可以降低单线程的IO时间,从而最大限度的提升单线程的效率

2、实现协程

gevent模块:遇到I/O自动切换并保存状态

使用gevent模块中的monkey,monkey.patch_all()来监视是否遇到IO操作,再使用spawn来创建协程,使用joinall替代join,使协程运行完再结束线程,joinall中放入得到的对象到列表中

from gevent import spawn
from gevent import joinall
from gevent import monkey
import time

# 补丁:监听所有的任务是否有IO操作
monkey.patch_all()


def task1(name):
    print(f'{name}开始')
    time.sleep(1)
    print(f'{name}结束')


def task2():
    print('task2开始')
    time.sleep(3)
    print('task2结束')


def task3():
    print('task3开始')
    time.sleep(5)
    print('task3结束')


if __name__ == '__main__':
    start_time = time.time()
    # 创建协程
    sp1 = spawn(task1,'task1')
    sp2 = spawn(task2)
    sp3 = spawn(task3)
    # sp1.join()
    # sp2.join()
    # sp3.join()
    joinall([sp1, sp2, sp3]) # 相当于 sp.join(),注意放入列表中
    end_time = time.time()
    print(end_time - start_time)
    # task1开始
    # task2开始
    # task3开始
    # task1结束
    # task2结束
    # task3结束
    # 5.013161897659302
posted @ 2019-12-10 21:34  Mr沈  阅读(186)  评论(0编辑  收藏  举报