python线程(二)代码部分Threading模块
一、threading类简介
1、threading.Thread类参数简介
class threading.Thread(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None)
group:目前此参数为None,在实现ThreadGroup类时为将来的扩展保留。
target:target接收的是一个函数的地址,由run()方法调用执行函数中的内容。默认为无,表示未调用任何内容。
name :线程名,可自行定义。
args:target接收的是函数名,此函数的位置参数以元组的形式存放在args中,用于执行函数时调用。
kwargs :target接收的是函数名,此函数的关键字参数以字典的形式存放在kwargs中,用于执行函数时调用。
daemon:如果为True表示该线程为守护线程。
2、threading.Thread类的常用方法
start():开启线程,一个Thread对象只能调用一次start()方法,如果在同一线程对象上多次调用此方法,则会引发RuntimeError。
run():执行start()方法会调用run(),该方将创建Thread对象时传递给target的函数名,和传递给args、kwargs的参数组合成一个完整的函数,并执行该函数。run()方法一般在自定义Thead类时会用到。
join(timeout=None):join会阻塞、等待线程,timeout单位为秒,因为join()总是返回none,所以在设置timeout调用join(timeout)之后,需要使用isalive()判断线程是否执行完成,如果isalive为True表示线程在规定时间内没有执行完,线程超时。如果join(timeout=None)则会等待线程执行完毕后才会执行join()后面的代码,一般用于等待线程结束。
name:获取线程名。
getName():获取线程名。
setName(name):设置线程名。
ident:“线程标识符”,如果线程尚未启动,则为None。如果线程启动是一个非零整数。
is_alive():判断线程的存活状态,在run()方法开始之前,直到run()方法终止之后。如果线程存活返回True,否则返回False。
daemon:如果thread.daemon=True表示该线程为守护线程,必须在调用Start()之前设置此项,否则将引发RuntimeError。默认为False
isDaemon():判断一个线程是否是守护线程。
setDaemon(daemonic):设置线程为守护线程。
二、threading.Thread的简单使用
创建线程:
from threading import Thread def work(args,kwargs=None): print(args) print(kwargs) if __name__ == "__main__": t = Thread(target=work, args=(("我是位置参数"),), kwargs={'kwargs': '我是关键字参数'}, name='我是线程demo') print(t.name) # 打印线程名 t.start() # 开启线程 print('我是主线程') # 打印内容如下 我是线程demo 我是位置参数 我是关键字参数 我是主线程
由上面的打印内容我们可以看出,在执行完所有线程后才执行的主线程print。如果是多进程的话会先执行主进程中的print然后才会执行子进程的print。主要是因为开启进程相比于开启线程更加耗费时间。
自定义线程类
from threading import Thread def work(args,kwargs=None): print(args) print(kwargs)
class MyThread(Thread): # 使用继承Thread的方式,自定义线程类 def __init__(self,target=None, name=None, args=(), kwargs=None, *, daemon=None): # 如果要给对象封装属性,必须先调用父类 super().__init__() if kwargs is None: kwargs = {} self._target = target self._name = name self._args = args self._kwargs = kwargs def run(self): # 必须要有run类,因为start要调用 print(f"我重写了Thread类的run") self._target(*self._args,**self._kwargs) if __name__ == "__main__": t = MyThread(target=work,args=(('我是位置参数'),),kwargs={'kwargs':'我是关键字参数'},name='我是自定义线程类') # 创建线程对象 print(t.name) # 打印线程名 t.start() # 开启线程 print("主线程") # 打印内容如下 我是自定义线程类 我重写了Thread类的run 主线程 我是位置参数 我是关键字参数
多进程和多线程的效率对比
from threading import Thread from multiprocessing import Process import time def thread_work(name): print(f"{name}") def process_work(name): print(f"{name}") if __name__ == "__main__": # 进程执行效率 pro = [] start = time.time() for i in range(3): p = Process(target=process_work,args=(("进程-"+str(i)),)) p.start() pro.append(p) for i in pro: i.join() end = time.time() print("进程运行了:%s" %(end - start)) # 线程执行效率 thread_l = [] start = time.time() for i in range(3): t = Thread(target=process_work, args=(("线程-" + str(i)),)) t.start() thread_l.append(t) for i in thread_l: i.join() end = time.time() print("进程运行了:%s" % (end - start)) # 打印内容如下 进程-0 进程-1 进程-2 进程运行了:0.18501067161560059 线程-0 线程-1 线程-2 进程运行了:0.004000186920166016
我们可以从时间上看出,线程的效率是远远高于进程的。
守护线程
主线程会等待所有非守护线程执行完毕后,才结束主线程。主进程是进程内的代码结束后就结束主进程。
对比守护进程,代码执行完毕后立即关闭守护进程,因为在主进程看来代码执行完毕,主进程结束了,所以守护进程在代码结束后就被结束了。
守护线程会等待主线程的结束而结束。这是因为如果主线程结束意味着程序结束,主线程会一直等着所有非守护线程结束,回收资源然后退出程序,所以当所有非守护线程结束后,守护线程结束,然后主线程回收资源,结束程序。
下面对比守护进程和守护线程的示例:
先来看守护进程:
from multiprocessing import Process def process_work(name): print(f"{name}") if __name__ == "__main__": p = Process(target=process_work,args=("守护进程")) p.daemon=True p.start() print("主进程") # 打印内容如下 主进程
只打印了主进程,也就是说守护进程还没来得及执行程序就结束了。
再来看守护线程:
from threading import Thread def thread_work(name): print(name) if __name__ == "__main__": t = Thread(target=thread_work,args=("守护线程",)) t.daemon=True t.start() print("\n主线程") # 打印内容如下 守护线程 主线程
也许你会说是由于线程太快了,所以才执行了守护线程。下面我们在线程中阻塞一段时间,在来看看会发生什么效果。
from threading import Thread import time def thread_work(name): time.sleep(3) # 阻塞3秒 print(name) if __name__ == "__main__": t = Thread(target=thread_work,args=("守护线程",)) t.daemon=True t.start() print("\n主线程") # 打印内容如下 主线程 守护线程
守护线程还是被执行了,如果是守护进程,守护进程里的代码是不会被执行的。
线程锁Lock
Lock也称线程同步锁,互斥锁,原子锁,该对象只有两个方法:
acquire(blocking=True, timeout=-1):加锁。
参数:
blocking:当为True时表示加锁,只允许一个线程执行被加锁的代码。直到遇到release()解锁后其它线程才可以执行加锁部分的代码。当为False时表示不加锁,并且不能调用release()否则会报RuntimeError。
timeout:设置加锁时间,单位为秒。-1表示一直等待线程release()后,才允许其它线程执行加锁的代码。
release():释放锁。
未加锁的代码示例
from threading import Thread import time def work(): global n temp = n time.sleep(0.1) # 由于线程太快了,所以这里停顿下 n = temp -1 if __name__ == "__main__": n = 100 t_l = [] for i in range(100): t = Thread(target=work,args=()) t.start() t_l.append(t) for i in t_l: i.join() print(n) # 打印内容如下 99
在我们看来其实值应该是0的但却是99,就因为短暂停了0.1秒导致结果发生了变化。而我们这0.1秒的停留是模拟网络延迟或者进程调度等原因。造成了数据的结果的错乱。这个时候我们就需要线程锁来保证数据的安全性。
下面我们就通过给程序加锁,来保证数据的安全性:
from threading import Thread,Lock import time def work(lock): lock.acquire() # 加锁 global n temp = n time.sleep(0.1) # 由于线程太快了,所以这里停顿下 n = temp -1 lock.release() # 解锁 if __name__ == "__main__": n = 100 t_l = [] lock = Lock() # 得到一把锁对象 for i in range(100): t = Thread(target=work,args=(lock,)) t.start() t_l.append(t) for i in t_l: i.join() print(n) # 打印内容如下 0
我们会发现程序和上一个示例的运行效率上有着很大的差别。明显加锁后程序的运行效率降低了,我们管这种锁叫做线程同步锁,使原本并行的程序编程了串行所以程序的效率会慢很多,但是程序的运行结果是正确的。在程序的运行效率和数据的正确性,我们应首先确保程序的正确性然后在考虑程序的效率。
递归锁RLock
死锁与递归锁:
所谓死锁: 是指两个或两个以上的进程或线程在执行过程中,出现了一种互相等待的情况,它们都将无法进行下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程,如下模拟产生死锁。
from threading import Lock,Thread def work(): # 获取锁 lock.acquire() print("我是工作线程 1") # 释放锁 lock.release() def work_2(): # 获取锁 lock.acquire() print("我是工作线程 2") work() # 调用工作线程1,造成死锁 # 释放锁 lock.release() if __name__ == '__main__': # 生成lock实例 lock = Lock() # 开始3个线程 for i in range(3): t = Thread(target=work_2) t.start() print('我是主线程') # 打印内容如下 我是主线程 我是工作线程 2 # 此时程序处于死锁状态
我们可以理解为一把锁对象只能创建一把锁,这把锁必须release后,才能再次使用。否则程序就会被锁住,等待解锁。如上面的代码,work_2执行创建一个lock锁,调用work又遇到一把lock锁,而在work_2中的lock锁没有被解锁,所以程序在work中等待lock解锁,最终造成了程序出现了死锁,下面我们使用递归锁RLock来解决上面的问题。
关于RLock的用法及方法一样,所以这里就不再重复了。
使用RLock避免死锁:
from threading import RLock,Thread def work(): # 获取锁 lock.acquire() print("我是工作线程 1") # 释放锁 lock.release() def work_2(): # 获取锁 lock.acquire() print("我是工作线程 2") work() # 调用工作线程1,造成死锁 # 释放锁 lock.release() if __name__ == '__main__': # 使用递归锁RLock lock = RLock() # 开始3个线程 for i in range(3): t = Thread(target=work_2) t.start() print('我是主线程') # 打印内容如下 我是工作线程 2 我是工作线程 1 我是工作线程 2 我是工作线程 1 我是工作线程 2 我是主线程 我是工作线程 1
使用递归锁后程序运行正常了。
条件对象Condition(lock=None)
Condition条件变量,与锁相关联,在实例化对象时可以给其传入一把锁,如果不传,会默认创建一把递归锁。目前我对它的就理解是它是一把带通知,挂起线程功能的锁。它可以挂起线程,然后发送通知激活线程,并且还可以加锁,属于一把高级锁,下面我们来看看常用的方法。
1、Condition类的方法
class threading.Condition([lock])
acquire():加锁、与Lock、RLock中的用法一致,这里不过多解释。
release():解锁、与Lock、RLock中的用法一致,这里不过多解释。
wait(timeout=None):挂起线程,如果timeout是None则必须等到notify或notify_all
后线程才会被激活,并且被激活的线程会重新获取到一把锁,线程被激活后从wait挂起的位置继续向下执行。如果指定timeout超时时间,单位为秒,表示线程挂起一段时间后在继续执行。注意:如果调用线程在调用此方法时未获取锁,则会引发RuntimeError。
wait_for(predicate, timeout=None):这个不知道该如何解释。
notify(n=1):激活被挂起的线程,n表示激活n个被挂起的线程,注意:如果调用线程在调用此方法时未获取锁,则会引发RuntimeError。
notify_all():激活所有被挂起的线程,注意:如果调用线程在调用此方法时未获取锁,则会引发RuntimeError。。
2、下面是一个无聊的实例:
from threading import Condition,Thread import time def consume(): '''消费者''' global cv global num cv.acquire() while True: num -= 1 if num <= 0: print('-' * 20) cv.notify() # 激活生产者线程 cv.wait() print(f'消费数据-{num}') time.sleep(2) cv.release() def produce(): '''生产者''' global cv global num cv.acquire() while 1: num += 1 print(f'生产数据-{num}') if num >= 5: print('-' * 20) cv.notify() # 激活消费者线程 cv.wait() time.sleep(0.5) cv.release() if __name__ == '__main__': cv = Condition() # 实例化条件对象 num = 0 # 开启线程 produce_t = Thread(target=produce, args=()) consume_t = Thread(target=consume, args=()) produce_t.start() consume_t.start()
Threading类的方法:
threading.
active_count
():获取当前活动的线程对象数量。
threading.
current_thread
():获取当前的线程对象。如果调用方的控制线程不是通过线程模块创建的,则返回功能有限的虚拟线程对象。
threading.
get_ident
():获取线程标识符。
threading.
enumerate
():这个比较厉害,可以获取当前活动的所有线程对象的列表。该列表包括后台线程和使用current_thread()创建的虚拟线程。以列表的形式返回。
threading.
main_thread
():获取主线程对象。
Threading模块就简单介绍到这里吧,参考文档:https://docs.python.org/3/library/threading.html#threading.Condition.notify
下一篇:python协程简介:https://www.cnblogs.com/caesar-id/p/10771369.html