python:多线程
线程
线程是一种多任务编程的方式,可以使用计算机多核资源。线程又被称为轻量级的进程
线程特征
- 线程是计算机核心分配的最小单位
- 一个进程可以包含多个线程,线程是进程中的一个成员,线程中改的变量,是进程中的变量。并没有新开辟一个空间
- 线程也是一个运行过程,也要消耗计算机资源。多个线程共享其进程的资源和空间
- 线程也拥有自己特有的资源属性,比如指令集,TID等
- 线程无论创建还是删除还是运行资源消耗都小于进程
- 多个线程之间并行执行,互不干扰
from threading import Thread
threading线程模块
创建线程对象
t = Thread(target, args, kwargs)
参数
- target:函数名
- args:元组 给线程函数位置传参
- kwargs:字典 给线程函数键值传参
t.start():启动线程
t.join(timeout):回收线程
import os, threading # 线程函数 def music(): print("进程pid号", os.getpid()) global a print("a = ", a) a = 10000 a = 1 t = threading.Thread(target=music) # 创建线程对象 t.start() # 启动线程 print("进程pid号", os.getpid()) t.join() # 回收线程 print("Main a:", a) # 进程pid号 12549 # 进程pid号 12549 # a = 1 # Main a: 10000
线程的其他属性
t.is_alive():查看线程状态
t.name:线程名称 默认Thread-1
t.setName():设置线程名称
threading.currentThread():获取当前线程对象
from threading import Thread, currentThread from time import sleep # 线程函数 def fun(sec): sleep(sec) # 获取线程对象 getName()获取名字 print("%s 线程结束" % currentThread().getName()) thread = [] for i in range(3): t = Thread(target=fun, name="name_%d" % i, args=(3,)) # 创建线程对象 thread.append(t) # 添加线程 t.start() # 启动线程 print(t.is_alive()) # 查看进程状态 # 回收线程 for i in thread: i.join() # True # True # True # name_1 线程结束 # name_2 线程结束 # name_0 线程结束
t.daemon:默认情况下,主线程的结束不会影响分支线程,如果设置为True则主线程退出分支线程也会退出
t.daemon = True 或 t.setDaemon(True)
线程daemon属性的设置在start前;一般设置daemon后不会使用join
from threading import Thread from time import sleep def fun(): sleep(3) print("线程属性测试") t = Thread(target=fun, name = "Tarena") # 主线程退出分支线程也退出 t.setDaemon(True) t.start() t.setName("Tedu") print("Name:",t.getName()) # 线程名称 print("Alive:",t.is_alive()) # 线程生命周期 print("is Daemon",t.isDaemon()) # 主进程随着分支进程退出
自定义线程类
步骤:
- 继承Thread类
- 运行Thread类中的__init__方法以获取父类属性
- 重写run方法
使用方法:
- 实例化对象
- 调用start自动化执行run方法
- 调用join回收线程
from threading import Thread class ThreadClass(Thread): # 重写父类init def __init__(self): super().__init__() # 继承父类init def fun1(self): print("函数1") def fun2(self): print("函数2") # 重写run,逻辑调用 def run(self): self.fun1() self.fun2() t = ThreadClass() t.start() t.join() # 函数1 # 函数2
线程间通信方法
线程间使用全局变量进行通信
多个进程或者线程都可以操作的资源称为共享资源。对共享资源的无序操作可能会带来数据的混乱,或者操作错误。此时往往需要同步互斥机制协调操作顺序。
同步互斥机制
同步:同步是一种协作关系,为完成该操作,多进程或者线程间形成一种协调,按照必要的步骤有序执行操作。
互斥:互斥是一种制约关系,当一个进程或者线程占有资源时会进行加锁处理,此时其他进程线程就无法操作该资源,直到解锁后才能操作。
线程同步互斥方法
线程Event
from threading import Event
e = Event():创建线程event对象
e.wait([timeout]):阻塞等待e被set
e.set():设置e,使wait结束阻塞
e.clear():使e回到未被设置状态
e.is_set():查看当前e是否被设置
from threading import Thread,Event s = None # 用于通信 e = Event() # 创建event对象 def 杨子荣(): print("杨子荣前来拜山头") global s s = "天王盖地虎" e.set() # 对e设置 t = Thread(target=杨子荣) t.start() print("说对口令就是自己人") e.wait() # 阻塞等待口令说出 if s == '天王盖地虎': print("宝塔镇河妖") print("确认过眼神,你是对的人") else: print("打死他...") t.join()
线程锁 Lock
from threading import Lock
lock = Lock():创建锁对象
lock.acquire():上锁 如果lock已经上锁再调用会阻塞
lock.release():解锁
with lock: # 上锁,with代码块结束自动解锁
from threading import Thread,Lock a = b = 0 lock = Lock() # 定义锁 def value(): while True: lock.acquire() # 上锁 if a != b: print("a = %d,b = %d"%(a,b)) lock.release() # 解锁 t = Thread(target = value) t.start() while True: # 上锁 with lock: a += 1 b += 1 # 自动解锁 t.join()
python线程的GIL问题
GIL (全局解释器锁)
python ---》 支持线程操作 ---》IO的同步和互斥 --》 加锁 ----》 超级锁,给解释器加锁
后果:一个解释器,同一时刻只解释一个线程,此时其他线程需要等待。大大降低了python线程的执行效率
python GIL问题解决方案
- 修改c解释器
- 尽量使用多进程进行并行操作
- python线程可以用在高延迟多阻塞的IO情形
- 不使用cpython c# java做解释器
进程和线程的区别和联系
- 两者都是多任务编程的方式,都能够使用计算机的多核
- 进程的创建删除要比线程消耗更多的计算机资源
- 进程空间独立,数据安全性好,有专门的进程间通信方法
- 线程使用全局变量通信,更加简单,但是需要同步互斥操 作
- 一个进程可以包含多个线程,线程共享进程的空间资源
- 进程线程都独立执行,有自己的特有资源如属性,id, 命令集等
使用情况:
- 一个进程中并发任务比较多,比较简单,适合使用多线程
- 如果数据程序比较复杂,特别是可能多个任务通信比较多 的时候,要考虑到使用线程同步互斥的复杂性
- 多个任务存在明显差异,和功能分离的时候没有必要一定 写入到一个进程中
- 使用python考虑线程GIL问题