python 线程与进程
线程和进程简介
- 应用程序和进程以及线程的关系?
- 一个应用程序里可以有多个进程,一个进程里可以有多个线程 最原始的计算机是如何运行的?
- CPU是什么?为什么要使用多个CPU?
- 为什么要使用多线程?
- 为什么要使用多进程?
- java和C#中的多线程和python多线程的区别?
- python多线程和傻缺的GIL python
- 如何让程序真正的实现同时运行?
- 线程和进程的选择:计算密集型和IO密集型程序。(IO操作不占用CPU)
进程的开销通常比线程昂贵, 因为线程自动共享内存地址空间和文件描述符. 意味着, 创建进程比创建线程会花费更多
在执行一些sleep/read/write/recv/send这些会导致阻塞的函数时,当前线程会主动放弃GIL,然后调用相应的系统API,完成后再重新申请GIL。因此,GIL也并不是导致Python的多线程完全没用,在一些IO等待的场合,Python多线程还是发挥了作用,当然如果多线程都是用于CPU密集的代码,那多线程的执行效率就明显会比单线程的低。
多线程开发
threading用于提供线程相关的操作,线程是应用程序中工作的最小单元。python当前版本的多线程库没有实现优先级、线程组,线程也不能被停止、暂停、恢复、中断。
threading模块提供的类:
Thread, Lock, Rlock, Condition, [Bounded]Semaphore, Event, Timer, local。
threading 模块提供的常用方法:
threading.currentThread(): 返回当前的线程变量。
threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
threading 模块提供的常量:
threading.TIMEOUT_MAX 设置threading全局超时时间。
Thread是线程类,有两种使用方法,直接传入要运行的方法或从Thread继承并覆盖run():
1 #coding:utf8 2 3 import threading 4 import time 5 6 #方法一,将要执行的方法作为参数传给Thread的构造方法 7 def action(arg): 8 time.sleep(1) 9 print 'the arg is:%s\r' %arg 10 time.sleep(1) 11 12 for i in xrange(3): 13 t = threading.Thread(target=action,args=(i,)) 14 t.start() 15 16 print 'main_thread end!'
1 #coding:Utf8 2 import threading 3 import time 4 5 6 #方法二:从Thread继承,并重写run() 7 class MyThread(threading.Thread): 8 def __init__(self,arg): 9 super(MyThread, self).__init__()#注意:一定要显式的调用父类的初始化函数。 10 self.arg=arg 11 def run(self):#定义每个线程要运行的函数 12 time.sleep(1) 13 print 'the arg is:%s\r' % self.arg 14 15 for i in xrange(4): 16 t =MyThread(i) 17 t.start() 18 19 print 'main thread end!'
构造方法:
Thread(group=None, target=None, name=None, args=(), kwargs={})
group: 线程组,目前还没有实现,库引用中提示必须是None;
target: 要执行的方法;
name: 线程名;
args/kwargs: 要传入方法的参数。
实例方法:
isAlive(): 返回线程是否在运行。正在运行指启动后、终止前。
get/setName(name): 获取/设置线程名。
start(): 线程准备就绪,等待CPU调度
is/setDaemon(bool): 获取/设置是后台线程(默认前台线程(False))。(在start之前设置)
如果是后台线程,主线程执行过程中,后台线程也在进行,主线程执行完毕后,后台线程不论成功与否,主线程和后台线程均停止
如果是前台线程,主线程执行过程中,前台线程也在进行,主线程执行完毕后,等待前台线程也执行完成后,程序停止
start(): 启动线程。
join([timeout]): 阻塞当前上下文环境的线程,直到调用此方法的线程终止或到达指定的timeout(可选参数)。
1 #coding:utf8 2 import threading 3 import time 4 5 def action(arg): 6 time.sleep(1) 7 print 'sub thread start!The thread name is: %s\r' % threading.currentThread().getName() 8 print 'The arg is:%s\r' %arg 9 time.sleep(1) 10 11 for i in xrange(4): 12 t = threading.Thread(target=action,args=(i,)) 13 t.start() 14 15 print 'main_thread end!'
1 main_thread end! 2 sub thread start!The thread name is: Thread-1 3 The arg is:0 4 sub thread start!The thread name is: Thread-2 5 The arg is:1 6 sub thread start!The thread name is: Thread-3 7 The arg is:2 8 sub thread start!The thread name is: Thread-4 9 The arg is:3
可以看出,创建的4个“前台”线程,主线程执行过程中,前台线程也在进行,主线程执行完毕后,等待前台线程也执行完成后,程序停止。
验证了setDeamon(False)(默认)前台线程,主线程执行过程中,前台线程也在进行,主线程执行完毕后,等待前台线程也执行完成后,主线程停止。
1 #coding:UTF8 2 3 import threading 4 import time 5 6 def action(arg): 7 time.sleep(1) 8 print 'Sub thread start,The thread name is: %s\r' % threading.currentThread().getName() 9 print 'The arg is:' % arg 10 time.sleep(1) 11 12 for i in xrange(3): 13 t = threading.Thread(target=action,args=(i,)) 14 t.setDaemon(True) 15 t.start() 16 17 print 'main_thread end!'
1 main_thread end!
验证了setDeamon(True)后台线程,主线程执行过程中,后台线程也在进行,主线程执行完毕后,后台线程不论成功与否,主线程均停止。
设置join
1 #coding:UTF8 2 3 import threading 4 import time 5 6 def action(arg): 7 time.sleep(1) 8 print 'Sub thread start,The thread name is: %s\r' % threading.currentThread().getName() 9 print 'The arg is: %s\r' % arg 10 time.sleep(1) 11 12 thread_list = [] 13 for i in xrange(3): 14 t = threading.Thread(target=action,args=(i,)) 15 t.setDaemon(True) 16 thread_list.append(t) 17 18 for t in thread_list: 19 t.start() 20 21 for t in thread_list: 22 t.join() 23 print 'main_thread end!'
1 Sub thread start,The thread name is: Thread-2 2 The arg is: 1 3 Sub thread start,The thread name is: Thread-3 4 The arg is: 2 5 Sub thread start,The thread name is: Thread-1 6 The arg is: 0 7 main_thread end!
设置join之后,主线程等待子线程全部执行完成后或者子线程超时后,主线程才结束
验证了 join()阻塞当前上下文环境的线程,直到调用此方法的线程终止或到达指定的timeout,即使设置了setDeamon(True)主线程依然要等待子线程结束。
join不妥当的用法,使多线程编程顺序执行
1 #coding:UTF8 2 3 import threading 4 import time 5 6 def action(arg): 7 time.sleep(1) 8 print 'Sub thread start,The thread name is: %s\r' % threading.currentThread().getName() 9 print 'The arg is: %s\r' % arg 10 time.sleep(1) 11 12 13 for i in xrange(3): 14 t = threading.Thread(target=action,args=(i,)) 15 t.setDaemon(True) 16 t.start() 17 t.join() 18 print 'main_thread end!'
1 Sub thread start,The thread name is: Thread-1 2 The arg is: 0 3 Sub thread start,The thread name is: Thread-2 4 The arg is: 1 5 Sub thread start,The thread name is: Thread-3 6 The arg is: 2 7 main_thread end! 8 9 10 可以看出此时,程序只能顺序执行,每个线程都被上一个线程的join阻塞,使得“多线程”失去了多线程意义。
例子:(生产者与消费者模型)
1 #coding:UTF8 2 3 import threading 4 from Queue import Queue 5 import time 6 7 class Producer(threading.Thread): 8 9 def __init__(self,name,queue): 10 ''' 11 @param name:生产者的名称 12 @param queue:容器 13 ''' 14 self.__Name = name 15 self.__Queue = queue 16 super(Producer,self).__init__() 17 18 def run(self): 19 while True: 20 if self.__Queue.full(): 21 time.sleep(1) 22 else: 23 self.__Queue.put('baozi') 24 time.sleep(1) 25 print '%s 生产了一个包子' %(self.__Name) 26 #threading.Thread.run(self) 27 28 29 class Consumer(threading.Thread): 30 31 def __init__(self,name,queue): 32 ''' 33 @param name:生产者的名称 34 @param queue:容器 35 ''' 36 self.__Name = name 37 self.__Queue = queue 38 super(Consumer,self).__init__() 39 40 def run(self): 41 while True: 42 if self.__Queue.empty(): 43 time.sleep(1) 44 else: 45 self.__Queue.get() 46 time.sleep(1) 47 print '%s 消耗了一个包子' %(self.__Name) 48 49 #threading.Thread.run(self) 50 51 que = Queue(maxsize=100) 52 53 baogou1 = Producer('老苟1',que) 54 baogou1.start() 55 baogou2 = Producer('老苟2',que) 56 baogou2.start() 57 baogou3 = Producer('老苟3',que) 58 baogou3.start() 59 60 for i in range(20): 61 name = '奥黑子%d' %(i,) 62 temp = Consumer(name,que) 63 temp.start() 64 65 66 67
1 老苟1 生产了一个包子 2 老苟2 生产了一个包子 3 老苟3 生产了一个包子 4 奥黑子0 消耗了一个包子 5 奥黑子1 消耗了一个包子 6 奥黑子2 消耗了一个包子 7 ..... 8 9 10 一直循环下去
Lock、Rlock类
由于线程之间随机调度:某线程可能在执行n条后,CPU接着执行其他线程。为了多个线程同时操作一个内存中的资源时不产生混乱,我们使用锁。
Lock(指令锁)是可用的最低级的同步指令。Lock处于锁定状态时,不被特定的线程拥有。Lock包含两种状态——锁定和非锁定,以及两个基本的方法。
可以认为Lock有一个锁定池,当线程请求锁定时,将线程至于池中,直到获得锁定后出池。池中的线程处于状态图中的同步阻塞状态。
RLock(可重入锁)是一个可以被同一个线程请求多次的同步指令。RLock使用了“拥有的线程”和“递归等级”的概念,处于锁定状态时,RLock被某个线程拥有。拥有RLock的线程可以再次调用acquire(),释放锁时需要调用release()相同次数。
可以认为RLock包含一个锁定池和一个初始值为0的计数器,每次成功调用 acquire()/release(),计数器将+1/-1,为0时锁处于未锁定状态。
简言之:Lock属于全局,Rlock属于线程。
构造方法:
Lock(),Rlock(),推荐使用Rlock()
实例方法:
acquire([timeout]): 尝试获得锁定。使线程进入同步阻塞状态。
release(): 释放锁。使用前线程必须已获得锁定,否则将抛出异常。
1 #coding:UTF8 2 3 import threading 4 import time 5 6 gl_num = 0 7 8 def show(arg): 9 global gl_num 10 time.sleep(1) 11 gl_num += 1 12 print gl_num 13 14 for i in range(10): 15 t = threading.Thread(target=show,args=(i,)) 16 t.start() 17 18 print 'main_thread stop!'
1 main_thread stop! 2 1 3 2 4 34 5 6 56 7 8 7 9 91010 10 11 12 多次运行可能产生混乱。这种场景就是适合使用锁的场景。
1 #coding:UTF8 2 3 import threading 4 import time 5 6 gl_num = 0 7 8 Lock = threading.RLock() 9 10 11 # 调用acquire([timeout])时,线程将一直阻塞, 12 # 直到获得锁定或者直到timeout秒后(timeout参数可选)。 13 # 返回是否获得锁 14 def show(arg): 15 Lock.acquire() 16 global gl_num 17 time.sleep(1) 18 gl_num += 1 19 print gl_num 20 Lock.release() 21 22 for i in range(10): 23 t = threading.Thread(target=show,args=(i,)) 24 t.start() 25 26 print 'main_thread stop!'
1 main_thread stop! 2 1 3 2 4 3 5 4 6 5 7 6 8 7 9 8 10 9 11 10 12 13 14 可以看出,全局变量在在每次被调用时都要获得锁,才能操作,因此保证了共享数据的安全性
Lock对比Rlock
1 #coding:UTF8 2 3 import threading 4 5 lock = threading.Lock() 6 lock.acquire() 7 lock.acquire() #产生了死锁 8 9 lock.release() 10 lock.release() 11 12 print lock.acquire()
没有结果输出
1 #coding:utf8 2 import threading 3 rLock = threading.RLock() #RLock对象 4 rLock.acquire() 5 rLock.acquire() ##在同一线程内,程序不会堵塞。 6 rLock.release() 7 rLock.release() 8 print rLock.acquire
输出结果:
<bound method _RLock.acquire of <_RLock owner=None count=0>>
Condition类
Condition(条件变量)通常与一个锁关联。需要在多个Contidion中共享一个锁时,可以传递一个Lock/RLock实例给构造方法,否则它将自己生成一个RLock实例。
可以认为,除了Lock带有的锁定池外,Condition还包含一个等待池,池中的线程处于等待阻塞状态,直到另一个线程调用notify()/notifyAll()通知;得到通知后线程进入锁定池等待锁定。
构造方法:
Condition([lock/rlock])
实例方法:
acquire([timeout])/release(): 调用关联的锁的相应方法。
wait([timeout]): 调用这个方法将使线程进入Condition的等待池等待通知,并释放锁。使用前线程必须已获得锁定,否则将抛出异常。
notify(): 调用这个方法将从等待池挑选一个线程并通知,收到通知的线程将自动调用acquire()尝试获得锁定(进入锁定池);其他线程仍然在等待池中。调用这个方法不会释放锁定。使用前线程必须已获得锁定,否则将抛出异常。
notifyAll(): 调用这个方法将通知等待池中所有的线程,这些线程都将进入锁定池尝试获得锁定。调用这个方法不会释放锁定。使用前线程必须已获得锁定,否则将抛出异常。
例子:
1 #coding:UTF8 2 3 import threading 4 import time 5 6 # 商品 7 product = None 8 # 条件变量 9 con = threading.Condition() 10 11 12 # 生产者方法 13 def produce(): 14 global product 15 16 if con.acquire(): 17 while True: 18 if product is None: 19 print 'produce...' 20 product = 'anything' 21 22 # 通知消费者,商品已经生产 23 con.notify() 24 25 # 等待通知 26 con.wait() 27 time.sleep(2) 28 29 30 # 消费者方法 31 def consume(): 32 global product 33 34 if con.acquire(): 35 while True: 36 if product is not None: 37 print 'consume...' 38 product = None 39 40 # 通知生产者,商品已经没了 41 con.notify() 42 43 # 等待通知 44 con.wait() 45 time.sleep(2) 46 47 48 t1 = threading.Thread(target=produce) 49 t2 = threading.Thread(target=consume) 50 t2.start() 51 t1.start()
1 produce... 2 consume... 3 produce... 4 consume... 5 produce... 6 consume... 7 produce... 8 consume... 9 produce... 10 consume... 11 produce... 12 13 14 一直循环下去
例二:
1 #coding:UTF8 2 3 import threading 4 import time 5 6 condition = threading.Condition() 7 products = 0 8 9 class Producer(threading.Thread): 10 def run(self): 11 global products 12 while True: 13 if condition.acquire(): 14 if products < 10: 15 products += 1; 16 print "Producer(%s):deliver one, now products:%s" %(self.name, products) 17 condition.notify()#不释放锁定,因此需要下面一句 18 condition.release() 19 else: 20 print "Producer(%s):already 10, stop deliver, now products:%s" %(self.name, products) 21 condition.wait();#自动释放锁定 22 time.sleep(2) 23 24 class Consumer(threading.Thread): 25 def run(self): 26 global products 27 while True: 28 if condition.acquire(): 29 if products > 1: 30 products -= 1 31 print "Consumer(%s):consume one, now products:%s" %(self.name, products) 32 condition.notify() 33 condition.release() 34 else: 35 print "Consumer(%s):only 1, stop consume, products:%s" %(self.name, products) 36 condition.wait(); 37 time.sleep(2) 38 39 if __name__ == "__main__": 40 for p in range(0, 2): 41 p = Producer() 42 p.start() 43 44 for c in range(0, 3): 45 c = Consumer() 46 c.start()
1 Producer(Thread-1):deliver one, now products:1 2 Producer(Thread-2):deliver one, now products:2 3 Consumer(Thread-3):consume one, now products:1 4 Consumer(Thread-4):only 1, stop consume, products:1 5 Consumer(Thread-5):only 1, stop consume, products:1 6 Producer(Thread-2):deliver one, now products:2 7 Consumer(Thread-4):consume one, now products:1 8 Consumer(Thread-4):only 1, stop consume, products:1 9 Producer(Thread-1):deliver one, now products:2 10 Consumer(Thread-3):consume one, now products:1 11 Producer(Thread-2):deliver one, now products:2 12 Consumer(Thread-5):consume one, now products:1 13 14 15 16 循环下去
例三:
1 #coding:UTF8 2 import threading 3 4 alist = None 5 condition = threading.Condition() 6 7 def doSet(): 8 if condition.acquire(): 9 while alist is None: 10 condition.wait() 11 for i in range(len(alist))[::-1]: 12 alist[i] = 1 13 condition.release() 14 15 def doPrint(): 16 if condition.acquire(): 17 while alist is None: 18 condition.wait() 19 for i in alist: 20 print i, 21 print 22 condition.release() 23 24 def doCreate(): 25 global alist 26 if condition.acquire(): 27 if alist is None: 28 alist = [0 for i in range(10)] 29 condition.notifyAll() 30 condition.release() 31 32 tset = threading.Thread(target=doSet,name='tset') 33 tprint = threading.Thread(target=doPrint,name='tprint') 34 tcreate = threading.Thread(target=doCreate,name='tcreate') 35 tset.start() 36 tprint.start() 37 tcreate.start()
1 0 0 0 0 0 0 0 0 0 0
Event类
Event(事件)是最简单的线程通信机制之一:一个线程通知事件,其他线程等待事件。Event内置了一个初始为False的标志,当调用set()时设为True,调用clear()时重置为 False。wait()将阻塞线程至等待阻塞状态。
Event其实就是一个简化版的 Condition。Event没有锁,无法使线程进入同步阻塞状态。
构造方法:
Event()
实例方法:
isSet(): 当内置标志为True时返回True。
set(): 将标志设为True,并通知所有处于等待阻塞状态的线程恢复运行状态。
clear(): 将标志设为False。
wait([timeout]): 如果标志为True将立即返回,否则阻塞线程至等待阻塞状态,等待其他线程调用set()。
例子一
1 #coding:UTF8 2 3 import threading 4 import time 5 6 event = threading.Event() 7 8 9 def func(): 10 # 等待事件,进入等待阻塞状态 11 print '%s wait for event...' % threading.currentThread().getName() 12 event.wait() 13 14 # 收到事件后进入运行状态 15 print '%s recv event.' % threading.currentThread().getName() 16 17 18 t1 = threading.Thread(target=func) 19 t2 = threading.Thread(target=func) 20 t1.start() 21 t2.start() 22 23 time.sleep(2) 24 25 # 发送事件通知 26 print 'MainThread set event.' 27 event.set()
1 Thread-1 wait for event... 2 Thread-2 wait for event... 3 MainThread set event. 4 Thread-1 recv event. 5 Thread-2 recv event.
timer类
Timer(定时器)是Thread的派生类,用于在指定时间后调用一个方法。
构造方法:
Timer(interval, function, args=[], kwargs={})
interval: 指定的时间
function: 要执行的方法
args/kwargs: 方法的参数
实例方法:
Timer从Thread派生,没有增加实例方法。
例:
1 #coding:UTF8 2 import threading 3 4 5 def func(): 6 print 'hello timer!' 7 8 9 timer = threading.Timer(5, func) 10 timer.start()
线程延迟5秒后执行。
local类
local是一个小写字母开头的类,用于管理 thread-local(线程局部的)数据。对于同一个local,线程无法访问其他线程设置的属性;线程设置的属性不会被其他线程设置的同名属性替换。
可以把local看成是一个“线程-属性字典”的字典,local封装了从自身使用线程作为 key检索对应的属性字典、再使用属性名作为key检索属性值的细节。
1 #coding:UTF8 2 import threading 3 4 local = threading.local() 5 local.tname = 'main' 6 7 def func(): 8 local.tname = 'notmain' 9 print local.tname 10 11 t1 = threading.Thread(target=func) 12 t1.start() 13 t1.join() 14 15 print local.tname
1 notmain 2 main