线程基础
线程
1.什么是线程?
线程与进程都是虚拟单位,目的是为了更好的描述某种事物。
进程:资源单位
线程:执行单位
开启一个进程,一定会有一个线程,线程才是真正的执行者
2.为什么要使用线程?
节省内存资源。
2.1开启进程
- 开辟一个名称空间,每开启一个进程都会占用一份内存资源。
- 会自带一个线程
2.2开启线程
- 一个进程可以开启多个线程
- 线程的开销远小于进程。
注意:线程不能实现并行,线程只能实现并发,进程可以实现并行。
而且线程之间数据是共享的。
3.GIL全局解释器锁
3.1 GIL是什么?
GIL本质上是一个互斥锁。
3.2 GIL有什么用?
GIL的作用是阻止同一个进程内多个线程同时执行(并行)。
- 单个进程下的多个进程无法实现并行,但能实现并发。
3.3 为什么要有GIL?
GIL锁可以使内存管理是“数据安全”的。
GIL的存在就是为了保证线程安全。
注意:多个线程过来执行,一旦遇到IO操作,就会立马释放GIL解释器锁,把锁教给下一个线程使用。
4.多线程的作用
不同的任务有不同的特性,有的属于计算密集型,有的属于IO密集型,对于不同的任务而言,使用进程还是使用线程会对CPU的使用效率造成极大的差别。
结论:
-
在计算密集型的情况下:
使用多进程
-
在IO密集型的情况下:
使用多线程
-
高效执行多个进程,内多个IO密集型的程序:
使用 多进程 + 多线程
'''
- 四个任务, 计算密集型, 每个任务需要10s:
单核:
- 开启进程
消耗资源过大
- 4个进程: 40s
- 开启线程
消耗资源远小于进程
- 4个线程: 40s
多核:
- 开启进程
并行执行,效率比较高
- 4个进程: 10s
- 开启线程
并发执行,执行效率低.
- 4个线程: 40s
- 四个任务, IO密集型, 每个任务需要10s:
单核:
- 开启进程
消耗资源过大
- 4个进程: 40s
- 开启线程
消耗资源远小于进程
- 4个线程: 40s
多核:
- 开启进程
并行执行,效率小于多线程,因为遇到IO会立马切换CPU的执行权限
- 4个进程: 40s + 开启进程消耗的额外时间
- 开启线程
并发执行,执行效率高于多进程
- 4个线程: 40s
'''
from threading import Thread
from multiprocessing import Process
import os
import time
# 计算密集型
def work1():
number = 0
for line in range(100000000):
number += 1
# IO密集型
def work2():
time.sleep(1)
if __name__ == '__main__':
# 测试计算密集型
# print(os.cpu_count()) # 6
# # 开始时间
# start_time = time.time()
# list1 = []
# for line in range(6):
# p = Process(target=work1) # 程序执行时间5.300818920135498
# # p = Thread(target=work1) # 程序执行时间24.000795602798462
#
# list1.append(p)
# p.start()
# IO密集型
print(os.cpu_count()) # 6
# 开始时间
start_time = time.time()
list1 = []
for line in range(40):
# p = Process(target=work2) # 程序执行时间4.445072174072266
p = Thread(target=work2) # 程序执行时间1.009237289428711
list1.append(p)
p.start()
for p in list1:
p.join()
end_time = time.time()
print(f'程序执行时间{end_time - start_time}')
5.死锁现象
两个线程执行任务时,在调用已经被别的线程调用了的全局锁时,会卡住。
6.递归锁
用于解决死锁问题。
RLock:比喻成万能钥匙,可以提供给多个人去使用。
第一次使用时,会对该锁做一个引用计数,只有引用计数为0,才能真正释放这个锁,让另一个人去使用。
7.信号量
互斥锁:同一时间只能让一个人去使用。
信号量:同一时间可以让多个人去使用。
8.线程队列
FIFO队列:先进先出
LIFO队列:后进先出
优先级队列:根据参数内元素的每一个字符排列,按照字符编码的顺序排先后。