线程
一、基本概念
程序:程序可以理解成是一系列的指令集,程序是静态。
进程:当程序运行时,会创建一个进程。
线程:进程基本执行单元,一个进程至少有一个线程。
进程和线程之间的关系:
一个线程只属于一个进程,一个进程中可以包含很多线程,只有一个主线程。
进程资源、线程的资源对比:
进程具有独立的空间和系统资源。
线程没有独立的空间和系统资源,同一个进程下的多个线程共享该进程中的资源的。
问题:多线程中对于共享资源修改的问题-----多线程同步问题----线程不安全。
二、多线程
单核cpu下:并行:宏观,微观上来看,仍然是串行
多核cpu:真正并行
计算机cpu执行,IO操作场合
计算密集型:不适合单核cpu多线程
io密集型:适合单核cpu的多线程
多线程的缺点
(1)线程本身也是程序,也是需要占内存,线程越多,占用的内存就越多 。
(2)多线程之间的调用需要协调管理,需要cpu进行线程的跟踪
(3)重要:多线程之间对共享资源的访问有影响,必须解决线程共享资源的问题,否则会导致数据的不一致。
三、线程的创建
三种方式
- 使用threading模块创建,通过指定target和args参数,创建线程
- 使用Thread类,重写run方法
- 使用线程池(高阶)
方式1
import time
import threading
# def mission(end):
# for i in range(end):
# print(i)
# time.sleep(0.5)
# target函数的名字
# args参数,必须使用元组传递
# t1=threading.Thread(target=mission,args=(10,))
# t2=threading.Thread(target=mission,args=(10,))
#激活线程,不是执行线程,把当前线程任务加入到cpu的任务执行列表中
等待cpu分配时间片来执行
# t1.start()
# t2.start()
方式2
# # class MyThread(threading.Thread):
# def __init__(self,end):
# self.end=end
# super().__init__()
# def run(self):
# for i in range(self.end):
# print(i)
# t1=MyThread(10)
# t2=MyThread(10)
# t1.run()------先执行完----任务顺序执行
# t2.run()------后执行完----任务顺序执行
# t1.start()-----将任务交给CPU,任务可以交替执行
# t2.start()-----将任务交给CPU,任务可以交替执行
当需要创建很多个执行相同方法的线程对象时,建议使用继承Thread类,重写run方法,run方法才是真正执行任务函数的方法。
start方法和run方法有什么区别?
start: 激活线程,不代表真正的执行,使得线程处于就绪状态,加入cpu执行任务列表。
run:真正执行任务的函数。
方式3
线程池创建线程的两种方式:
进程池下的线程池、第三方安装包threadpool。
进程池下的线程池
(1)multiprocessing.pool
from multiprocessing.pool import ThreadPool
同步apply
异步
# def work(i):
# print("第{}个线程开始".format(i))
# time.sleep(1)
#
# if __name__=="__main__":
# print("主程序执行开始")
# pool=ThreadPool(3)
# for i in range(3):
# pool.apply_async(work,args=(i,))
# args为一个元组,当为单个元素时,元素后面加“,”。
# pool.close()
# pool.join()
# print("主程序执行完毕")
def sum2(b1,b2):
pool = ThreadPool(3)
for i in range(10):
pool.apply_async(sum,args=(0,b1))
pool.apply_async(sum,args=(0,b2))
pool.close()
pool.join()
# if __name__=="__main__":
# start=time.time()
# # sum2(10000000,20000000)
# sum2(10,20)
# end=time.time()
# print("执行的时间{}".format(end-start))
第三方安装包threadpool
安装第三方包 pip install 包名
import threadpool
(1)引入threadpool模块。
(2)定义线程函数。
(3)创建线程池threadpool.ThreadPool(maxsize)。
(4)创建需要线程池处理的任务列表
requests= threadpool.makeRequests()。
(5)将创建的多个任务put到线程池中。线程池对象.putRequests(任务)。
(6)等到所有任务处理完毕。线程池对象.wait()----先用close再用join效果类似。
makeRequests(任务,参数列表)
参数列表:[((参数1,参数2),(字典型参数1,字典型参数2))]
def work(i):
print("第{}线程开始执行".format(i))
time.sleep(1)
print("第{}线程执行结束".format(i))
# if __name__=="__main__":
# pool= threadpool.ThreadPool(5)
# requests=threadpool.makeRequests(work,args_list=range(3))
# for r in requests:
# pool.putRequest(r) # 类似执行start
#
# pool.wait()
# print("主程序执行完毕")
def sum3(b1,b2):
pool=threadpool.ThreadPool(5)
asl=[((0,b1),None),((0,b2),None)]
requests=threadpool.makeRequests(sum,args_list=asl)
for i in requests:
pool.putRequest(i)
pool.wait()
if __name__=="__main__":
start=time.time()
# sum3(10000000,20000000)
sum3(10,20)
end=time.time()
print("执行的时间{}".format(end-start))
四、线程的生命周期
1. 新建:(人的出生): 创建线程对象,没有执行能力。
2. 就绪:(等待就业): 调用了start方法,不是马上执行,把执行权利交给cpu。
3. 运行:(入职工作): 执行线程的任务,获得了cpu的时间片,cpu在一个线程运行的时候,是可能将时间片分配给其他线程。
4. 阻塞:(生病) : 处于等待的过程中(调用sleep),cpu不会将时间片分给阻塞状态的进程。
5. 死亡:(死亡) :run方法执行完毕,run方法中抛出没有捕获的异常。