8.12并发编程二线程

一。进程间的通信

  在进程中,可以通过Queue队列进行通信,队列有两个特点:

  1.先进先出。(先来的数据先被取出)

  2.管道式存取。(数据取出一次后就不会在有了)

  在python中有以下方法来操作数据。

from multiprocessing import Queue

q = Queue(5)
for i in range(5):
    q.put(i)
print(q.empty())
print(q.full())
for i in range(5):
    print(q.get())
print(q.get_nowait())
print(q.empty())

  其中put()就是在其中放入数据。

  get()从该队列中取出数据,如果队列中没有了数据,程序就会阻塞在这。

  empty()判断这个对列是否为空。

  full()判断这个数据是否为满

  get_nowait()非阻塞获取数据。也就是当队列中没有数据时就抛出异常

  这3个方法在多进程中不会常用,因为,是根据当前状态判断数据和获取数据。

二。进程之间使用队列

  在各个子进程之间的数据传输,可使用队列+锁(ipc机制)进行传输,将对列作为参数传入子进程函数:

from multiprocessing import Queue,Process

def producer(q):
    for i in range(5):
        q.put(i)

def consumer(q):
    for i in range(5):
        print(q.get())

if __name__ == '__main__':
    q = Queue(5)
    p1 = Process(target=producer,args=(q,))
    p2 = Process(target=consumer, args=(q,))
    p1.start()
    p2.start()
    print('end')
#end
#0
#1
#2
#3
#4

三。生产者与消费者模型

  在python中,可以模拟生产者与消费者模型,创建一个名为producer的作为生产者。

  创建一个名为consumer的作为消费者。

  生产者输出一定的数据,消费者持续不断的接受数据。

  两个进程之间使用队列进行数据交互:

def producer(name,thing,q):
    for i in range(10):
        data = '%s生产了%s%s'%(name,thing,i)
        time.sleep(random.random())
        q.put(data)
        print(data)

def consumer(name,q):
    while True:
        data = q.get()
        time.sleep(random.random())
        print('%s获取了%s'%(name,data))

if __name__ == '__main__':
    q = Queue()
    p = Process(target=producer,args=('zzj','手机',q))
    c = Process(target=consumer,args=('zzp',q))
    p.start()
    c.start()

  这种模型有一种缺陷,会在程序的最后卡住,因为最后执行消费者的语句中没有终止条件,所以会一直索要数据,所以要对这个模型进行改进。

def producer(name,thing,q):
    for i in range(10):
        data = '%s生产了%s%s'%(name,thing,i)
        time.sleep(random.random())
        q.put(data)
        print(data)

def consumer(name,q):
    while True:
        data = q.get()
        time.sleep(random.random())
        if data == None:
            break
        print('%s获取了%s'%(name,data))

if __name__ == '__main__':
    q = Queue()
    p = Process(target=producer,args=('zzj','手机',q))
    c = Process(target=consumer,args=('zzp',q))
    p.start()
    c.start()
    p.join()
    q.put(None)

  先添加一个生产者生产完毕的阻塞p.join,当所有的数据生产完毕后,像队列中添加一个None,再从消费者里添加判断,当消费者获取到了None之后,代表之后不会再生产数据了就跳出while循环。

  当然,这样的模型在实际使用时,会遇到多个进程的情况,就要多次使用put(None)方法。

  使用JoinableQueue队列就可以使用其中的task_done()计算消费者消费了多少数据。其中的join阻塞的是,当队列中的数据被全部取空的时候,继续执行以下的程序

def producer(name,thing,q):
    for i in range(10):
        data = '%s生产了%s%s'%(name,thing,i)
        time.sleep(random.random())
        q.put(data)
        print(data)

def consumer(name,q):
    while True:
        data = q.get()
        time.sleep(random.random())
        print('%s获取了%s'%(name,data))
        q.task_done()

if __name__ == '__main__':
    q = JoinableQueue()
    p = Process(target=producer,args=('zzj','手机',q))
    p1 = Process(target=producer, args=('zzj2', '手机2', q))
    c = Process(target=consumer,args=('zzp',q))
    c1 = Process(target=consumer, args=('zzp2', q))
    p.start()
    p1.start()
    c.daemon  = True
    c1.daemon = True
    c1.start()
    c.start()
    p.join()
    p1.join()
    q.join()

  其工作流程如下:
  1.首先创建两个生产者。

  2.创建两个消费者。

  3.开始所有工作,如果没有阻塞的情况,在下达生产的指令后,就立即结束主进程,消费者会随着守护进程一起与主进程结束,所以只有生产没有消费。

  4.将生产者程序阻塞,当所有生产结束时,再执行以下代码,其中消费者在不断消费。

  5.最后通过队列的阻塞,确保消费者消费了生产者的所有数据,再继续以下程序。

四。线程

  1.什么是线程

  进程:资源单位

  线程:执行单位

    将内存比如成工厂,那么进程就相当于是工厂里面的车间,而你的线程就相当于是车间里面的流水线

    ps:每个进程都自带一个线程,线程才是真正的执行单位,进程只是在线程运行过程中提供代码运行所需要的资源

  2.为什么要有线程

    开进程

    1.申请内存空间 耗资源

    2."拷贝代码" 耗资源

    开线程

    一个进程内可以起多个线程,并且线程与线程之间数据是共享的

    ps:开启线程的开销要远远小于开启进程的开销

五。如何使用线程

  线程的使用方式与进程的使用相差无几,区别在于,线程可以不在main函数中使用,但是还是习惯于在main函数创建线程。

from threading import Thread
import time

def text(name):
    print('start%s'%name)
    time.sleep(2)
    print('end%s'%name)

t = Thread(target=text,args=('lzx',))
t.start()
print('zhu')
#startlzx
#zhu
#endlzx

  值得注意的是,在线程中,有很大概率先运行线程中的程序,因为线程的启动远比进程的启动早,所有会比主程序快一点。

   线程中的一些方法

  线程中的方法与进程中的方法有相似之处,他们的启动都是差不多。

import os
from threading import Thread,current_thread,active_count
import time

def text(name):
    print('start%s'%name)
    print('',current_thread().name)
    print('',os.getpid())
    time.sleep(2)
    print('end%s'%name)


if __name__ == '__main__':
    t = Thread(target=text,args=('lzx',))
    t2 = Thread(target=text, args=('lzx1',))
    print('', current_thread().name)
    print('', os.getpid())
    t.start()
    t2.start()
    print('当前运行线程的个数',active_count())
    print('zhu')

#主 MainThread
#主 28364
#startlzx
#子 Thread-1
#子 28364
#startlzx1
#子 Thread-2
#子 28364
#当前运行线程的个数 3
#zhu
#endlzx
#endlzx1

  os.getpid()查看线程的线程号

  current_thread()线程对象,可以通过name查看该线程的线程号。一个进程下的线程号都是一样的

  active_count()查看当前正在运行的线程的个数。注意,主线程也是一个正在运行的线程

  ps:线程没有主次之分。

六。守护线程

  在线程中也有daemon方法,将线程设置成主线程的守护线程。

def text(name):
    print('子线程%s'%name)
    time.sleep(2)
    print('end')

t = Thread(target=text,args=('lzx',))
t.start()
print('')

  普通线程中,主线程总是会在子线程结束之后才会结束,除了守护线程

  主线程的结束意味着进程的结束

  (子线程在运行的时候需要使用进程中的资源,而主线程一旦结束了资源也就销毁了)

def text(name):
    print('子线程%s'%name)
    time.sleep(2)
    print('end')

t = Thread(target=text,args=('lzx',))
t.daemon = True
t.start()
print('')

  当一个线程需要较长的时间运行时(大于主线程的时间),而这个线程是一个守护线程,则它不会运行完。

  如上,end就永远不会被打印。

七。线程之间的通信

  

from threading import Thread


money = 666

def task():
    global money
    money = 999

t = Thread(target=task)
t.start()
t.join()
print(money)

  在一个进程中,多个线程使用的是同一个数据,所以,线程与线程之间的数据是互通的。

  使用join等待数据完完全全改变后打印该数据,发现它已经通过线程改变了。

八。互斥锁的应用

  在线程中,也有互斥锁的概念,该功能是将并行操作变成串行操作。

import time
from threading import Thread,Lock

n = 100

def text(sock):
    global n
    tmp = n
    time.sleep(0.1)
    n = tmp -1

t_list = []
sock = Lock()
for i in range(100):
    t = Thread(target=text,args=(sock,))
    t.start()
    t_list.append(t)

for i in t_list:
    i.join()

print(n)

  上定义了100个线程,将所有线程启动后添加至线程列表,再将他们阻塞,也就是当所有的线程执行-操作结束后再输出结果

  注意不能直接对原数据-1,否则会直接为0.

  为了体现线程的并行性,可以对其先进行赋值tmp,再将元数据变成该值的-1

  如果是串行操作,会直接为0。

  结果显然不是,因为所有线程一起获得了数据100,0.1秒后再将100-1赋值给n,结果就是n被赋值99,100次。

  加上锁后,就不会出现这样的效果。

import time
from threading import Thread,Lock

n = 100

def text(sock):
    global n
    sock.acquire()
    tmp = n
    time.sleep(0.1)
    n = tmp -1
    sock.release()

t_list = []
sock = Lock()
for i in range(100):
    t = Thread(target=text,args=(sock,))
    t.start()
    t_list.append(t)

for i in t_list:
    i.join()

print(n)

九。小例子

from threading import Thread
from multiprocessing import Process
import time
def foo():
    print(123)
    time.sleep(1)
    print("end123")

def bar():
    print(456)
    time.sleep(3)
    print("end456")

if __name__ == '__main__':
    t1=Thread(target=foo)
    t2=Thread(target=bar)
    t1.daemon=True
    t1.start()
    t2.start()
    print("main-------")
#123
#456
#main-------
#end123
#end456

 

posted on 2019-08-12 17:32  一只萌萌哒的提莫  阅读(156)  评论(0编辑  收藏  举报