Python 中多线程共享全局变量的问题
在之前,我们讲过了,Python 中多个线程之间是可以共享全局变量的数据的。
但是,多线程共享全局变量是会出问题的。
假设两个线程 t1 和 t2 都要对全局变量 g_num (默认是0)进行加1运算,t1 和 t2 都各对 g_num 加10次,g_num 的最终的结果应该为20。
但是由于多线程是同时操作,有可能出现下面情况:
在 g_num=0 时,t1 取得 g_num=0。此时系统把 t1 调度为”sleeping”状态,把t2转换为”running”状态,t2 也获得 g_num=0。
然后 t2 对得到的值进行加1并赋给 g_num,使得 g_num=1 。
接着系统又把 t2 调度为”sleeping”,把 t1 转为”running”。线程t1又把它之前得到的0加1后赋值给g_num。
这样导致虽然 t1 和 t2 都对 g_num 加1,但结果仍然是 g_num=1。
先看例子:
import threading
import time
g_num = 0
def work1(num):
global g_num
for i in range(num):
g_num += 1
print("----in work1, g_num is %d---" % g_num)
def work2(num):
global g_num
for i in range(num):
g_num += 1
print("----in work2, g_num is %d---" % g_num)
print("---线程创建之前g_num is %d---" % g_num)
t1 = threading.Thread(target=work1, args=(100,))
t1.start()
t2 = threading.Thread(target=work2, args=(100,))
t2.start()
# 确保子线程都运行结束
while len(threading.enumerate()) != 1:
time.sleep(1)
print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)
运行结果:
---线程创建之前g_num is 0---
----in work1, g_num is 100---
----in work2, g_num is 200---
2个线程对同一个全局变量操作之后的最终结果是:200
乍一看,好像没出什么问题。那是因为数据太小了,我们现在把数据变大。
import threading
import time
g_num = 0
def work1(num):
global g_num
for i in range(num):
g_num += 1
print("----in work1, g_num is %d---" % g_num)
def work2(num):
global g_num
for i in range(num):
g_num += 1
print("----in work2, g_num is %d---" % g_num)
print("---线程创建之前g_num is %d---" % g_num)
t1 = threading.Thread(target=work1, args=(1000000,))
t1.start()
t2 = threading.Thread(target=work2, args=(1000000,))
t2.start()
# 确保子线程都运行结束
while len(threading.enumerate()) != 1:
time.sleep(1)
print("2个线程对同一个全局变量操作之后的最终结果是:%s" % g_num)
运行结果:
---线程创建之前g_num is 0---
----in work2, g_num is 1048576---
----in work1, g_num is 1155200---
2个线程对同一个全局变量操作之后的最终结果是:1155200
数越大,出现问题的概率越大,而且数据的偏差也越大。
结论
如果多个线程同时对同一个全局变量操作,会出现资源竞争问题,从而数据结果会不正确。
那能不能解决这个问题呢?
我们后面会讲同步和互斥锁的问题的。
通过同步和互斥锁,我们可以解决 Python 中多线程共享全局变量时发生错误的问题。
欢迎关注我的公众号《编程的朝圣之路》,带你一起从入门到入魔。