6-[多线程]-互斥锁、GIL、死锁、递归锁、信号量
1、互斥锁(排他锁)
(1)不加锁的情况下
并发控制问题:多个事务并发执行,可能产生操作冲突,出现下面的3种情况
- 丢失修改错误
- 不能重复读错误
- 读脏数据错误
# mutex from threading import Thread import time n = 100 def task(): global n temp = n time.sleep(0.1) n = temp - 1 print(n) if __name__ == '__main__': t_l = [] for i in range(100): t = Thread(target=task) t_l.append(t) t.start() for t in t_l: t.join() print('主done', n)
from threading import Thread,Lock import os,time def work(): global n lock.acquire() temp=n time.sleep(0.1) n=temp-1 lock.release() if __name__ == '__main__': lock=Lock() n=100 l=[] for i in range(100): p=Thread(target=work) l.append(p) p.start() for p in l: p.join() print(n) #结果肯定为0,由原来的并发执行变成串行,牺牲了执行效率保证了数据安全,不加锁则结果可能为99
(2)、添加互斥锁(排他锁)
锁: 排它锁(可以修改数据) 共享锁(只可以读数据)
2、GIL全局解释器锁
参考博客: http://www.cnblogs.com/venicid/p/7975892.html
GIL本质就是一把互斥锁,既然是互斥锁,所有互斥锁的本质都一样,都是将并发运行变成串行,以此来控制同一时间内共享数据只能被一个任务所修改,进而保证数据安全。
可以肯定的一点是:保护不同的数据的安全,就应该加不同的锁。
在一个python的进程内,不仅有test.py的主线程或者由该主线程开启的其他线程,还有解释器开启的垃圾回收等解释器级别的线程,总之,所有线程都运行在这一个进程内,毫无疑问
1、所有数据都是共享的,这其中,代码作为一种数据也是被所有线程共享的(test.py的所有代码以及Cpython解释器的所有代码)
例如:test.py定义一个函数work(代码内容如下图),在进程内所有线程都能访问到work的代码,于是我们可以开启三个线程然后target都指向该代码,能访问到意味着就是可以执行。
2、所有线程的任务,都需要将任务的代码当做参数传给解释器的代码去执行,即所有的线程要想运行自己的任务,首先需要解决的是能够访问到解释器的代码。
3、GIL与Lock
GIL 与Lock是两把锁,保护的数据不一样, 前者是解释器级别的(当然保护的就是解释器级别的数据,比如垃圾回收的数据), 后者是保护用户自己开发的应用程序的数据
1、100个线程去抢GIL锁,即抢执行权限 2、肯定有一个线程先抢到GIL(暂且称为线程1),然后开始执行,一旦执行就会拿到lock.acquire() 3、极有可能线程1还未运行完毕,就有另外一个线程2抢到GIL,然后开始运行,但线程2发现互斥锁lock还未被线程1释放,于是阻塞,被迫交出执行权限,即释放GIL 4、直到线程1重新抢到GIL,开始从上次暂停的位置继续执行,直到正常释放互斥锁lock,然后其他的线程再重复2 3 4的过程
4、GIL与多线程
要解决这个问题,我们需要在几个点上达成一致: 1、cpu到底是用来做计算的,还是用来做I/O的? 2、多cpu,意味着可以有多个核并行完成计算,所以多核提升的是计算性能 3、每个cpu一旦遇到I/O阻塞,仍然需要等待,所以多核对I/O操作没什么用处
结论: 1、对计算来说,cpu越多越好,但是对于I/O来说,再多的cpu也没用 2、当然对运行一个程序来说,随着cpu的增多执行效率肯定会有所提高(不管提高幅度多大,总会有所提高),这是因为一个程序基本上不会是纯计算或者纯I/O, 所以我们只能相对的去看一个程序到底是计算密集型还是I/O密集型,从而进一步分析python的多线程到底有无用武之地
5、多线程性能测试
计算密集型、io密集型
- 如果并发的多个任务是计算密集型:多进程效率高
# 计算密集型:多进程执行效率高 from multiprocessing import Process from threading import Thread import time import os def task(): print('子 is running') ret = 0 for i in range(10000000): ret *= i print('子 is done') if __name__ == '__main__': print(os.cpu_count()) # 查看电脑cup内核数量:本机为4核 start_time = time.time() # 开启四个进程 p_list = [] for i in range(4): p = Process(target=task) # 耗时3.21s # p = Thread(target=task) 耗时5.38秒 p_list.append(p) p.start() # 等待4个进程执行完成 for p in p_list: p.join() end_time = time.time() print('主done:<%s>' % (end_time-start_time))
- 如果并发的多个任务是I/O密集型:多线程效率高
# io密集型:多线程执行效率高 from multiprocessing import Process from threading import Thread import time import os def task(): print('子 is running') time.sleep(2) print('子 is done') if __name__ == '__main__': print(os.cpu_count()) # 查看电脑cup内核数量:本机为4核 start_time = time.time() # 开启400个进程 p_list = [] for i in range(400): p = Process(target=task) # 耗时56s,大部分时间浪费在创建进程上 # p = Thread(target=task) # 耗时2.15秒 p_list.append(p) p.start() for p in p_list: p.join() end_time = time.time() print('主done:<%s>' % (end_time-start_time))
6、死锁
from threading import Thread, Lock import time lockA = Lock() lockB = Lock() class Mythread(Thread): def run(self): self.task_a() self.task_b() def task_a(self): lockA.acquire() print('%s 拿到A锁1' % self.name) lockB.acquire() print('%s 拿到B锁1' % self.name) lockB.release() lockA.release() def task_b(self): lockB.acquire() print('%s 拿到B锁' % self.name) lockA.acquire() print('%s 拿到A锁' % self.name) lockA.release() lockB.release() if __name__ == '__main__': for i in range(10): t = Mythread() t.start()
7、递归锁
#一个线程拿到锁,counter加1,该线程内又碰到加锁的情况,则counter继续加1,这期间所有其他线程都只能等待,等待该线程释放所有锁,即counter递减到0为止
from threading import Thread, RLock import time lockA = lockB = RLock() # 递归锁 # 递归锁可以连续acquire多次,每acquire一次计数器+1,只有计数器为0时,才能被抢到 class Mythread(Thread): def run(self): self.task_a() self.task_b() def task_a(self): lockA.acquire() print('%s 拿到A锁1' % self.name) lockB.acquire() print('%s 拿到B锁1' % self.name) lockB.release() lockA.release() def task_b(self): lockB.acquire() print('%s 拿到B锁' % self.name) lockA.acquire() print('%s 拿到A锁' % self.name) lockA.release() lockB.release() if __name__ == '__main__': for i in range(10): t = Mythread() t.start()
8、信号量