安迪_963

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

1.开进程的两种方式:

1. 使用内置的进程

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/17


from multiprocessing import Process
import os

def get_id(name):
    print(name,"Main process:",os.getppid(),"current process;", os.getpid())

P1 = Process(target=get_id, args=('andy',))
P2 = Process(target = get_id, args=("Jack", ))

if __name__ == "__main__":
    P2.start()
    P1.start()

    print("主进程")

 2. 自定义进程类:

from multiprocessing import Process
import os

class Custom_Process(Process):
    def __init__(self, name):
        super().__init__()
        self.name = name

    def run(self):
        print(self.name, "Main process:", os.getppid(), "current process;", os.getpid())

if __name__ == "__main__":


    P1 = Custom_Process('andy')
    P2 = Custom_Process("jack")

    P1.start()
    P2.start()
    print("主进程")

 事实上在调用P1.start时,系统调用了Process类的run方法,在我们直接调用Process类时,

我们需要指定target(即要进行的操作,参数args),那么定制后我们重写了run方法,即重写的

run方法。

在Custom_Process类中我用到了

super().__init__()

 这是重写父类的方法之一,另一种方法是:

Parent.__init__(self)

在这里就是:Process.__init__()

关于super().__init__()事实上并不是调用父类,而是寻找继承顺序中的下一个

具体可以参考:Python’s super() considered super!

 

下面是一个应用进程的例子,之前在写 cs模型    时有:

server.listen(5)# 设置可以接受的连接数量

 虽然这里可以接受5个链接,但事实上由于功能上并未实现

所以每次只有一个链接可以正常进行通信,其他的链接都必须

等到之前的链接完成才行。

下面着手改进:

server

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/16


import socket,json, struct, subprocess
from multiprocessing import Process

BUFF_SIZE = 1024
IP_PORT = ("127.0.0.1", 8081)

server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR,1)# 重用端口
server.bind(IP_PORT)
server.listen(5)# 设置可以接受的连接数量

def communicate(conn, client_addr):
    while True:# 内层循环为通信循环
        msg = conn.recv(BUFF_SIZE)
        if not msg:
            break
        pipes = subprocess.Popen(msg.decode("utf-8"),
                                 shell=True,
                                 stdout=subprocess.PIPE,
                                 stderr=subprocess.PIPE
                                 )

        error = pipes.stderr.read()
        if error:
            print("Error:",error)
            response_msg = error
        else:
            response_msg = pipes.stdout.read()

        header = {'data_size':len(response_msg)}# 数据长度
        header_json = json.dumps(header)#序列化
        header_json_byte = bytes(header_json,encoding="utf-8")

        conn.send(struct.pack('i',len(header_json_byte)))
        #先发送报头长度,仅包含数据长度, 这里的i指int类型
        conn.send(header_json_byte)# 再发送报头
        conn.sendall(response_msg)# 正式的信息
        print("Request from:",client_addr, "Command:",msg)
    conn.close()
if __name__ == "__main__":
    while True:# 外层循环为链接循环
        conn, client_addr = server.accept()
        p = Process(target=communicate, args=(conn, client_addr))
        p.start()



    server.close()

 client未变:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/16


import socket, json, struct

BUFF_SIZE = 1024
IP_PORT = ("127.0.0.1", 8081)

client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.connect(IP_PORT)

while True:
    msg = input(">>:").strip().encode("utf-8")
    if not msg:
        break

    client.send(msg)

    header = client.recv(4)
    print("Header:",struct.unpack("i", header))
    header_length = struct.unpack('i', header)[0]
    print("Header_length:", header_length)
    header_json = json.loads(client.recv(header_length).decode("utf-8"))
    data_size = header_json['data_size']
    print("Data_size:",data_size)

    recv_size = 0
    recv_data = b''

    while recv_size < data_size:
        recv_data += client.recv(BUFF_SIZE)
        recv_size += len(recv_data)

    print(recv_data.decode("gbk"))

client.close()

 看下运行结果,这里只开了两个客户端,5个同样的道理:

 

2.LOCK 互斥锁:

import os, time
from multiprocessing import Process, Lock

def work(mutex):
    mutex.acquire()
    print("%d is working..." % os.getpid())
    time.sleep(2)
    print("%d is done!" % os.getpid())
    mutex.release()


if __name__ == "__main__":
    mutex = Lock()
    p1 = Process(target=work, args=(mutex,))
    p2 = Process(target=work, args=(mutex,))
    p1.start()
    p2.start()

模拟 抢票系统:所有人都可以查看到还剩下多票,但是只有部分人能抢到票。

import json, random, time, os
from multiprocessing import Process , Lock

def search():
    dic = json.load(open('db.txt',))
    print("%s查询,车票剩余%s" % (os.getpid(),dic['count']))

def get_ticket():
    dic = json.load(open('db.txt',))
    if dic['count'] > 0:
        dic['count'] -= 1
        time.sleep(random.randint(1,4))
        json.dump(dic,open('db.txt', 'w'))
        print('%s 购买成功' % os.getpid())
        print("车票剩下%s" % dic["count"])
    else:
        print("%s抢票失败 " % os.getpid())


def task(mutex):
    search()
    mutex.acquire()
    get_ticket()
    mutex.release()

if __name__ == "__main__":
    mutex = Lock()
    for i in range(10):
        p = Process(target=task, args=(mutex,))
        p.start()

 

 

 3.Join

1.join方法的作用是阻塞主进程(挡住,无法执行join以后的语句),专注执行多线程。

2.多线程多join的情况下,依次执行各线程的join方法,前头一个结束了才能执行后面一个。

3.无参数,则等待到该线程结束,才开始执行下一个线程的join。

4.设置参数后,则等待该线程这么长时间就不管它了(而该线程并没有结束)。不管的意思就是可以执行后面的主进程了。

看例子:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/19


import os, time
from multiprocessing import Process, Lock

def work(mutex, t):
    mutex.acquire()
    print("%s Running at %s\n" % (os.getpid(),time.strftime("%H:%M:%S")))
    time.sleep(t)
    mutex.release()
    print("%s Stop at %s\n" % (os.getpid(),time.strftime("%H:%M:%S")))


if __name__ == "__main__":
    print("Main Process Running at %s\n" % time.strftime("%H:%M:%S"))
    mutex = Lock()
    p1 = Process(target=work, args=(mutex,5))
    p2 = Process(target=work, args=(mutex,3))
    p1.start()
    p2.start()
    p1.join()
    print("Join1 finish at %s!\n" % time.strftime("%H:%M:%S"))
    p2.join()
    print("Join2 finish at %s!\n" % time.strftime("%H:%M:%S"))
    print("Main Process Stop at %s\n" % time.strftime("%H:%M:%S"))

 此时没有指定join的时长,所以,第一个进程执行完了,第一个join也相应的结束了,

然后第二个进程执行完了,第二个join也结束了。

 

当指定时间后分两种情况,当join的时间比进程需要执行的时间短时,它就不再等待该进行,直接执行

将join()修改为p2.join(2)

将p2.join()修改为p2.join(2)

 

可以看到,进程4768还未执行完时,join1等待2秒后直接不管它了,执行了后面的打印语句

接着执行了join2,等待2秒后,主进程自己结束了自己(这里应该是打印语句的原因,事实上并未直接的结束)

此时4768仍在运行,直到自己结束。然后才是进程11108

 

如果我将时间设置得比它需要的时间还长呢,那么它应该在进程运行完时也结束

将P1.join()修改为p1.join(6)

将p2.join()修改为p2.join(4)

 可以看到Join1,join2都是在两个进行结束后自己结束了,并没有等待设定的时间长度。

 

4.Daemon 守护进程

守护进程的作用:

一:守护进程会在主进程代码执行结束后就终止

二:守护进程内无法再开启子进程,否则抛出异常:AssertionError: daemonic processes are not allowed to have children

下面看例子:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/19


from multiprocessing import Process
import time

def work():
    print("Running...")
    time.sleep(3)
    print("Finish!")

if __name__ == "__main__":
    p = Process(target=work,)
    #p.daemon = True
    p.start()
    print("Main finish!")

运行结果:

 

将#p.daemon=True注释掉,再运行:

可以看到,主进程结束了,子进程也结束了, 并不会等待它运行完。

 

守护进程为什么在主进程结束后就结束了呢?

首先,我们要明白守护进程的作用:守护主进程的一些功能,当主进程执行完了,

也就是说它的功能已经全部执行完了,那么,守护进程也就没有继续守护下去的

必要了,所以一旦主进程结束了,守护进程也就结束了。

 

 5.Semaphore 信号量

Semaphore制对共享资源的访问数量,比如可以同时运行的子进程数量:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/19

import multiprocessing
import time

def worker(s):
    s.acquire()
    print(multiprocessing.current_process().name + "acquire");
    time.sleep(2)
    print(multiprocessing.current_process().name + "release\n");
    s.release()

if __name__ == "__main__":
    s = multiprocessing.Semaphore(2)
    for i in range(5):
        p = multiprocessing.Process(target = worker, args=(s,))
        p.start()

如上, 只有释放一个进程才有新的进程进来

 

将信号量改成大于等于进程数:

s = multiprocessing.Semaphore(5)

可以看到,所有进程一下全部启动了。

 

进程间通信有一个人种方式,一种是队列,一种是管道

6.队列

 下面演示在一个进程中往队列中传入数据,用另一个进程取出来:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/19

import random,os
from multiprocessing import Queue,Process

def put_q(q):
    print("Put...")
    for i in range(5):
        n = random.randint(1,5)
        print(n)
        q.put(n)

def get_q(q):
    print("\nGet...")
    while True:
        if not q.empty():
            print("%s" % os.getpid(),q.get())
        else:
            break


if __name__ == "__main__":
    q = Queue(8)
    p1 = Process(target=put_q,args=(q,))
    p2 = Process(target=get_q,args=(q,))
    p1.start()
    p1.join() # 防止进程2先启动,队列为空
    p2.start()

 

这样就实现了进程间的通信

 

7.管道

Pipe方法返回(conn1, conn2)代表一个管道的两个端。Pipe方法有duplex参数,
如果duplex参数为True(默认值),那么这个管道是全双工模式,
也就是说conn1和conn2均可收发。duplex为False,conn1只负责接受消息,conn2只负责发送消息。
 
send和recv方法分别是发送和接受消息的方法。例如,在全双工模式下,
可以调用conn1.send发送消息,conn1.recv接收消息。如果没有消息可接收,
recv方法会一直阻塞。如果管道已经被关闭,那么recv方法会抛出EOFError。
 
事实上,管道的应用与上面的队列基本一致,对上面的代码稍作修改:
#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/19


import random,os
from multiprocessing import Pipe,Process

def send_p(p):
    print("send...")
    for i in range(5):
        n = random.randint(1,5)
        print(n)
        p.send(n)

def receive_p(p):
    print("\nReceive...")
    while True:
        print("%s" % os.getpid(),p.recv())


if __name__ == "__main__":
    p = Pipe()
    p1 = Process(target=send_p,args=(p[0],))
    p2 = Process(target=receive_p,args=(p[1],))
    p1.start()
    p1.join() 
    p2.start()

运行:

 

8.Pool 进程池

 Pool可以提供指定数量的进程,供用户调用,当有新的请求提交到pool中时,

如果池还没有满,那么就会创建一个新的进程用来执行该请求;

但如果池中的进程数已经达到规定最大值,那么该请求就会等待,

直到池中有进程结束,才会创建新的进程来它。

看例子:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/20


import time
from multiprocessing import Pool, Process


def work(msg):
    print(msg, 'is working\n')
    time.sleep(2)
    print(msg,'finish!\n')

if __name__ == "__main__":
    pro = Process()
    pool = Pool(processes=3)
    for i in range(1,6):
        msg = "process %s" % i
        pool.apply_async(work,(msg,))

    pool.close()
    pool.join()# 阻塞主进程,等待子进程执行完

 运行:

指定进程池只有3个进程,所以第四个进程只有前面结束一个进程时才能开始。

需要说明的是 pool.apply_async()是非阻塞的,pool.apply()则是阻塞的。看区别:

修改:

pool.apply(work,(msg,))

 再次运行:

可以看到,子进程只能结束一个后都会运行下一个进程

 回调函数:

回调函数指:进程池中任何一个任务一旦处理完了,就立即告知主进程:

我好了额,你可以处理我的结果了。主进程则调用一个函数去处理该结果。

 

对上面的例子进行修改:

#!/usr/bin/env python
#coding:utf-8
#Created by Andy @ 2017/9/20


import time, os
from multiprocessing import Pool, Process


def work(msg):
    print(msg, 'is working\n')
    time.sleep(2)
    print(msg,'finish!\n')
    return msg

def plus(msg):
    if msg:
        msg = msg + '*plus*'
    print(msg)

if __name__ == "__main__":
    pro = Process()
    pool = Pool(processes=3)
    for i in range(1,6):
        msg = "process %s" % i
        pool.apply_async(work,(msg,), callback=plus)# 回调函数


    pool.close()
    pool.join()

 运行:

可以看到一个进程结果后,在开启一个新的进程到进程池后,

主进程又调用一个回调函数对该进程的结果进行了二次处理。

 

补充:

对于计算机来说,也并不能无限开启进程,通常比较好的情况是

进程数等于计算机核数是比较好的,否则开多了可能会起到反作用

那么要怎么查看自己的计算机是几核的呢?

 

posted on 2017-09-17 13:49  Andy_963  阅读(494)  评论(0编辑  收藏  举报