一。进程间的通信
在进程中,可以通过Queue队列进行通信,队列有两个特点:
1.先进先出。(先来的数据先被取出)
2.管道式存取。(数据取出一次后就不会在有了)
在python中有以下方法来操作数据。
from multiprocessing import Queue q = Queue(5) for i in range(5): q.put(i) print(q.empty()) print(q.full()) for i in range(5): print(q.get()) print(q.get_nowait()) print(q.empty())
其中put()就是在其中放入数据。
get()从该队列中取出数据,如果队列中没有了数据,程序就会阻塞在这。
empty()判断这个对列是否为空。
full()判断这个数据是否为满
get_nowait()非阻塞获取数据。也就是当队列中没有数据时就抛出异常
这3个方法在多进程中不会常用,因为,是根据当前状态判断数据和获取数据。
二。进程之间使用队列
在各个子进程之间的数据传输,可使用队列+锁(ipc机制)进行传输,将对列作为参数传入子进程函数:
from multiprocessing import Queue,Process def producer(q): for i in range(5): q.put(i) def consumer(q): for i in range(5): print(q.get()) if __name__ == '__main__': q = Queue(5) p1 = Process(target=producer,args=(q,)) p2 = Process(target=consumer, args=(q,)) p1.start() p2.start() print('end') #end #0 #1 #2 #3 #4
三。生产者与消费者模型
在python中,可以模拟生产者与消费者模型,创建一个名为producer的作为生产者。
创建一个名为consumer的作为消费者。
生产者输出一定的数据,消费者持续不断的接受数据。
两个进程之间使用队列进行数据交互:
def producer(name,thing,q): for i in range(10): data = '%s生产了%s%s'%(name,thing,i) time.sleep(random.random()) q.put(data) print(data) def consumer(name,q): while True: data = q.get() time.sleep(random.random()) print('%s获取了%s'%(name,data)) if __name__ == '__main__': q = Queue() p = Process(target=producer,args=('zzj','手机',q)) c = Process(target=consumer,args=('zzp',q)) p.start() c.start()
这种模型有一种缺陷,会在程序的最后卡住,因为最后执行消费者的语句中没有终止条件,所以会一直索要数据,所以要对这个模型进行改进。
def producer(name,thing,q): for i in range(10): data = '%s生产了%s%s'%(name,thing,i) time.sleep(random.random()) q.put(data) print(data) def consumer(name,q): while True: data = q.get() time.sleep(random.random()) if data == None: break print('%s获取了%s'%(name,data)) if __name__ == '__main__': q = Queue() p = Process(target=producer,args=('zzj','手机',q)) c = Process(target=consumer,args=('zzp',q)) p.start() c.start() p.join() q.put(None)
先添加一个生产者生产完毕的阻塞p.join,当所有的数据生产完毕后,像队列中添加一个None,再从消费者里添加判断,当消费者获取到了None之后,代表之后不会再生产数据了就跳出while循环。
当然,这样的模型在实际使用时,会遇到多个进程的情况,就要多次使用put(None)方法。
使用JoinableQueue队列就可以使用其中的task_done()计算消费者消费了多少数据。其中的join阻塞的是,当队列中的数据被全部取空的时候,继续执行以下的程序
def producer(name,thing,q): for i in range(10): data = '%s生产了%s%s'%(name,thing,i) time.sleep(random.random()) q.put(data) print(data) def consumer(name,q): while True: data = q.get() time.sleep(random.random()) print('%s获取了%s'%(name,data)) q.task_done() if __name__ == '__main__': q = JoinableQueue() p = Process(target=producer,args=('zzj','手机',q)) p1 = Process(target=producer, args=('zzj2', '手机2', q)) c = Process(target=consumer,args=('zzp',q)) c1 = Process(target=consumer, args=('zzp2', q)) p.start() p1.start() c.daemon = True c1.daemon = True c1.start() c.start() p.join() p1.join() q.join()
其工作流程如下:
1.首先创建两个生产者。
2.创建两个消费者。
3.开始所有工作,如果没有阻塞的情况,在下达生产的指令后,就立即结束主进程,消费者会随着守护进程一起与主进程结束,所以只有生产没有消费。
4.将生产者程序阻塞,当所有生产结束时,再执行以下代码,其中消费者在不断消费。
5.最后通过队列的阻塞,确保消费者消费了生产者的所有数据,再继续以下程序。
四。线程
1.什么是线程
进程:资源单位
线程:执行单位
将内存比如成工厂,那么进程就相当于是工厂里面的车间,而你的线程就相当于是车间里面的流水线
ps:每个进程都自带一个线程,线程才是真正的执行单位,进程只是在线程运行过程中提供代码运行所需要的资源
2.为什么要有线程
开进程
1.申请内存空间 耗资源
2."拷贝代码" 耗资源
开线程
一个进程内可以起多个线程,并且线程与线程之间数据是共享的
ps:开启线程的开销要远远小于开启进程的开销
五。如何使用线程
线程的使用方式与进程的使用相差无几,区别在于,线程可以不在main函数中使用,但是还是习惯于在main函数创建线程。
from threading import Thread import time def text(name): print('start%s'%name) time.sleep(2) print('end%s'%name) t = Thread(target=text,args=('lzx',)) t.start() print('zhu') #startlzx #zhu #endlzx
值得注意的是,在线程中,有很大概率先运行线程中的程序,因为线程的启动远比进程的启动早,所有会比主程序快一点。
线程中的一些方法
线程中的方法与进程中的方法有相似之处,他们的启动都是差不多。
import os from threading import Thread,current_thread,active_count import time def text(name): print('start%s'%name) print('子',current_thread().name) print('子',os.getpid()) time.sleep(2) print('end%s'%name) if __name__ == '__main__': t = Thread(target=text,args=('lzx',)) t2 = Thread(target=text, args=('lzx1',)) print('主', current_thread().name) print('主', os.getpid()) t.start() t2.start() print('当前运行线程的个数',active_count()) print('zhu') #主 MainThread #主 28364 #startlzx #子 Thread-1 #子 28364 #startlzx1 #子 Thread-2 #子 28364 #当前运行线程的个数 3 #zhu #endlzx #endlzx1
os.getpid()查看线程的线程号
current_thread()线程对象,可以通过name查看该线程的线程号。一个进程下的线程号都是一样的
active_count()查看当前正在运行的线程的个数。注意,主线程也是一个正在运行的线程
ps:线程没有主次之分。
六。守护线程
在线程中也有daemon方法,将线程设置成主线程的守护线程。
def text(name): print('子线程%s'%name) time.sleep(2) print('end') t = Thread(target=text,args=('lzx',)) t.start() print('主')
普通线程中,主线程总是会在子线程结束之后才会结束,除了守护线程
主线程的结束意味着进程的结束
(子线程在运行的时候需要使用进程中的资源,而主线程一旦结束了资源也就销毁了)
def text(name): print('子线程%s'%name) time.sleep(2) print('end') t = Thread(target=text,args=('lzx',)) t.daemon = True t.start() print('主')
当一个线程需要较长的时间运行时(大于主线程的时间),而这个线程是一个守护线程,则它不会运行完。
如上,end就永远不会被打印。
七。线程之间的通信
from threading import Thread money = 666 def task(): global money money = 999 t = Thread(target=task) t.start() t.join() print(money)
在一个进程中,多个线程使用的是同一个数据,所以,线程与线程之间的数据是互通的。
使用join等待数据完完全全改变后打印该数据,发现它已经通过线程改变了。
八。互斥锁的应用
在线程中,也有互斥锁的概念,该功能是将并行操作变成串行操作。
import time from threading import Thread,Lock n = 100 def text(sock): global n tmp = n time.sleep(0.1) n = tmp -1 t_list = [] sock = Lock() for i in range(100): t = Thread(target=text,args=(sock,)) t.start() t_list.append(t) for i in t_list: i.join() print(n)
上定义了100个线程,将所有线程启动后添加至线程列表,再将他们阻塞,也就是当所有的线程执行-操作结束后再输出结果
注意不能直接对原数据-1,否则会直接为0.
为了体现线程的并行性,可以对其先进行赋值tmp,再将元数据变成该值的-1
如果是串行操作,会直接为0。
结果显然不是,因为所有线程一起获得了数据100,0.1秒后再将100-1赋值给n,结果就是n被赋值99,100次。
加上锁后,就不会出现这样的效果。
import time from threading import Thread,Lock n = 100 def text(sock): global n sock.acquire() tmp = n time.sleep(0.1) n = tmp -1 sock.release() t_list = [] sock = Lock() for i in range(100): t = Thread(target=text,args=(sock,)) t.start() t_list.append(t) for i in t_list: i.join() print(n)
九。小例子
from threading import Thread from multiprocessing import Process import time def foo(): print(123) time.sleep(1) print("end123") def bar(): print(456) time.sleep(3) print("end456") if __name__ == '__main__': t1=Thread(target=foo) t2=Thread(target=bar) t1.daemon=True t1.start() t2.start() print("main-------") #123 #456 #main------- #end123 #end456