进程

进程理论

　　1、进程与程序的区别

　　　　程序：一堆代码（死的）

　　　　进程：正在运行的程序（活的）

　　2、单核情况下的进程调度

　　　　进程调度算法演变

　　　　1、FCFS 先来先开始缺点：对短作业不友好

　　　　2、短作业优先调度算法缺点：对长作业不友好

　　　　3、时间片轮转法+多级反馈队列

　　　　原理：先分配给新的多个进程相同的时间片；之后根据进程消耗的时间片多少分类别，越往下进程运行时间越长。

　　3、进程的三状态

　　　　在程序运行的过程中，由于被操作系统的调度算法控制，程序会进入几个状态：就绪，运行和阻塞。进程要想进入运行状态必须先经过就绪态

　　　　（1）就绪(Ready)状态

　　　　当进程已分配到除CPU以外的所有必要的资源，只要获得处理机便可立即执行，这时的进程状态称为就绪状态。

　　　　（2）执行/运行（Running）状态

　　　　当进程已获得处理机，其程序正在处理机上执行，此时的进程状态称为执行状态。

　　　　（3）阻塞(Blocked)状态

　　　　正在执行的进程，由于等待某个事件发生而无法执行时，便放弃处理机而处于阻塞状态。引起进程阻塞的事件可有多种，例如，等待I/O完成、申请缓冲区不能满足、等待信件(信号)等。

　　4、同步与异步

　　　　用于描述任务的提交方式

　　　　同步：提交完任务之后原地等待任务的返回结果，期间不做任何事情

　　　　异步：提交完任务之后不原地等待任务的返回结果，直接去做其他事情，结果由反馈机制自动提醒

　　5、阻塞与非阻塞

　　　　用于描述任务的执行状态

　　　　阻塞：阻塞态

　　　　非阻塞态：就绪态、运行态

process模块

　　process模块是一个创建进程的模块，借助这个模块，就可以完成进程的创建。

Process([group [, target [, name [, args [, kwargs]]]]])，由该类实例化得到的对象，表示一个子进程中的任务（尚未启动）

　　强调

　　　　1、需要使用关键字的方式来指定参数

　　　　2、args指定的为传给target函数的位置参数，是一个元组形式，必须有逗号

　　参数介绍

　　　　group参数未使用，值始终为None

　　　　target表示调用对象，即子进程要执行的任务

　　　　args表示调用对象的位置参数元组，args=(1,2,'jason',)

　　　　kwargs表示调用对象的字典,kwargs={'name':'jason','age':18}

　　　　name为子进程的名称

　　方法介绍

　　　　p.start()：启动进程，并调用该子进程中的p.run()

　　　　p.run():进程启动时运行的方法，正是它去调用target指定的函数，我们自定义类的类中一定要实现该方法

　　　　p.terminate():强制终止进程p，不会进行任何清理操作，如果p创建了子进程，该子进程就成了僵尸进程，使用该方法需要特别小心这种情况。如果p还保存了一个锁那么也将不会被释放，进而导致死锁

　　　　 p.is_alive():如果p仍然运行，返回True

　　　　 p.join([timeout]):主线程等待p终止（强调：是主线程处于等的状态，而p是处于运行的状态）。timeout是可选的超时时间，需要强调的是，p.join只能join住start开启的进程，而不能join住run开启的进程

开启进程的两种方式

　　windows操作系统下，创建进程一定要在main内创建，因为windows下创建进程类似于模块导入的方式，会从上往下依次执行代码

　　linux是将代码完整的拷贝一份

　　第一种方式

from multiprocessing import Process
import time


def task(name):
    print('%s is running'%name)
    time.sleep(3)
    print('%s is over'%name)


if __name__ == '__main__':
    # 1 创建一个对象
    p = Process(target=task, args=('jason',))
    # 容器类型哪怕里面只有1个元素 建议要用逗号隔开
    # 2 开启进程
    p.start()  # 告诉操作系统帮你创建一个进程  异步
    print('主')

　　第二种方式(了解）

# 第二种方式 类的继承
from multiprocessing import Process
import time


class MyProcess(Process):
    def run(self):
        print('hello bf girl')
        time.sleep(1)
        print('get out!')


if __name__ == '__main__':
    p = MyProcess()
    p.start()
    print('主')

　　总结：

　　创建进程就是在内存中申请一块内存空间将需要运行的代码丢进去

　　一个进程对应在内存中就是一块独立的内存空间

　　多个进程对应在内存中就是多块独立的内存空间

　　进程与进程之间数据默认情况下是无法直接交互,如果想交互可以借助于第三方工具、模块

jion方法

　　join是让主进程等待子进程代码运行结束之后，再继续运行。不影响其他子进程的执行

import time
from multiprocessing import Process

def f(name):
    print('hello', name)
    time.sleep(1)
    print('我是子进程')


if __name__ == '__main__':
    p = Process(target=f, args=('bob',))
    p.start()
    p.join()
    print('我是父进程')

进程之间的数据隔离问题

from multiprocessing import Process

def work():
    global n
    n=0
    print('子进程内: ',n)


if __name__ == '__main__':
    n = 100
    p=Process(target=work)
    p.start()
    print('主进程内: ',n)

进程对象

　　查看当前进程的进程号

current_process().pid  # 查看当前进程的进程号

　　查看当前进程进程号

os.getpid()

　　查看当前进程的父进程进程号

os.getppid()

　　杀死当前进程

p.terminate()

　　是告诉操作系统帮你去杀死当前进程但是需要一定的时间而代码的运行速度极快

　　判断当前进程是否存活

print(p.is_alive())

　　代码

from multiprocessing import Process, current_process
import time
import os


def task():
    # print('%s is running'%current_process().pid)  # 查看当前进程的进程号
    print('%s is running'%os.getpid())  # 查看当前进程的进程号
    # print('子进程的主进程号%s'%os.getppid())  # 查看当前进程的进程号
    time.sleep(30)


if __name__ == '__main__':
    p = Process(target=task)
    p.start()
    p.terminate()  # 杀死当前进程
    # 是告诉操作系统帮你去杀死当前进程 但是需要一定的时间 而代码的运行速度极快
    time.sleep(0.1)
    print(p.is_alive())  # 判断当前进程是否存活
    """
    一般情况下我们会默认将
    存储布尔值的变量名
    和返回的结果是布尔值的方法名
    都起成以is_开头
    """
    print('主')
    # print('主',current_process().pid)
    # print('主',os.getpid())
    # print('主主',os.getppid())  # 获取父进程的pid号

僵尸进程

　　通俗来讲就是死了没死透

　　当你开设了子进程之后该进程死后不会立刻释放占用的进程号

　　因为我要让父进程能够查看到它开设的子进程的一些基本信息占用的pid号运行时间。。。

　　所有的进程都会步入僵尸进程

孤儿进程

　　子进程存活，父进程意外死亡

　　操作系统会开设一个“儿童福利院”专门管理孤儿进程回收相关资源

守护进程

　　会随着主进程的结束而结束。

　　主进程创建守护进程

　　　　其一：守护进程会在主进程代码执行结束后就终止

　　　　其二：守护进程内无法再开启子进程,否则抛出异常：AssertionError: daemonic processes are not allowed to have children

　　注意：进程之间是互相独立的，主进程代码运行结束，守护进程随即终止

from multiprocessing import Process
import time


def task(name):
    print('%s总管正在活着'% name)
    time.sleep(3)
    print('%s总管正在死亡' % name)


if __name__ == '__main__':
    p = Process(target=task,args=('debang',))
    # p = Process(target=task,kwargs={'name':'debang'})
    p.daemon = True  # 将进程p设置成守护进程  这一句一定要放在start方法上面才有效否则会直接报错
    p.start()
    print('皇帝huangji寿终正寝')

互斥锁

　　多个进程操作同一份数据的时候，会出现数据错乱的问题

　　针对上述问题，解决方式就是加锁处理:将并发变成串行，牺牲效率但是保证了数据的安全

　　代码

from multiprocessing import Process, Lock
import json
import time
import random


# 查票
def search(i):
    # 文件操作读取票数
    with open('data','r',encoding='utf8') as f:
        dic = json.load(f)
    print('用户%s查询余票：%s'%(i, dic.get('ticket_num')))
    # 字典取值不要用[]的形式 推荐使用get  你写的代码打死都不能报错！！！


# 买票  1.先查 2.再买
def buy(i):
    # 先查票
    with open('data','r',encoding='utf8') as f:
        dic = json.load(f)
    # 模拟网络延迟
    time.sleep(random.randint(1,3))
    # 判断当前是否有票
    if dic.get('ticket_num') > 0:
        # 修改数据库 买票
        dic['ticket_num'] -= 1
        # 写入数据库
        with open('data','w',encoding='utf8') as f:
            json.dump(dic,f)
        print('用户%s买票成功'%i)
    else:
        print('用户%s买票失败'%i)


# 整合上面两个函数
def run(i, mutex):
    search(i)
    # 给买票环节加锁处理
    # 抢锁
    mutex.acquire()

    buy(i)
    # 释放锁
    mutex.release()


if __name__ == '__main__':
    # 在主进程中生成一把锁 让所有的子进程抢 谁先抢到谁先买票
    mutex = Lock()
    for i in range(1,11):
        p = Process(target=run, args=(i, mutex))
        p.start()

View Code

　　注意：

　　　　锁不要轻易的使用，容易造成死锁现象(我们写代码一般不会用到，都是内部封装好的)

　　　　锁只在处理数据的部分加来保证数据安全(只在争抢数据的环节加锁处理即可)

进程间通信

　　1、队列Queue模块

　　　判断当前队列是否满了

print(q.full())

　　判断当前队列是否空了

print(q.empty())

　　没有数据之后原地等待三秒之后再报错 queue.Empty

v6 = q.get(timeout=3)

　　代码

from multiprocessing import Queue

# 创建一个队列
q = Queue(5)  # 括号内可以传数字 标示生成的队列最大可以同时存放的数据量

# 往队列中存数据
q.put(111)
q.put(222)
q.put(333)
# print(q.full())  # 判断当前队列是否满了
# print(q.empty())  # 判断当前队列是否空了
q.put(444)
q.put(555)
# print(q.full())  # 判断当前队列是否满了

# q.put(666)  # 当队列数据放满了之后 如果还有数据要放程序会阻塞 直到有位置让出来 不会报错


# 去队列中取数据
v1 = q.get()
v2 = q.get()
v3 = q.get()
v4 = q.get()
v5 = q.get()
# print(q.empty())
# V6 = q.get_nowait()  # 没有数据直接报错queue.Empty
# v6 = q.get(timeout=3)  # 没有数据之后原地等待三秒之后再报错  queue.Empty
try:
    v6 = q.get(timeout=3)
    print(v6)
except Exception as e:
    print('一滴都没有了!')

# # v6 = q.get()  # 队列中如果已经没有数据的话 get方法会原地阻塞
# print(v1, v2, v3, v4, v5, v6)

　　注：

　　　　q.full()、q.empty()、q.get_nowait()，在多进程的情况下是不精确

　　2、IPC机制

　　　　　主进程跟子进程借助于队列通信

from multiprocessing import Queue, Process

def producer(q):
    q.put('我是23号技师 很高兴为您服务')
if __name__ == '__main__':
    q = Queue()
    p = Process(target=producer,args=(q,))
    p.start()
    print(p.get())

　　　　子进程跟子进程借助于队列通信

from multiprocessing import Queue, Process

def producer(q):
    q.put('我是23号技师 很高兴为您服务')


def consumer(q):
    print(q.get())


if __name__ == '__main__':
    q = Queue()
    p = Process(target=producer,args=(q,))
    p1 = Process(target=consumer,args=(q,))
    p.start()
    p1.start()

　　3、生产者消费者模型

　　　　生产者:生产/制造东西的

　　　　消费者:消费/处理东西的

　　　　该模型除了上述两个之外还需要一个媒介

　　　　生产者(做包子的) + 消息队列(蒸笼) + 消费者(吃包子的)

　　　　1、什么是生产者消费者模型

　　　　　　生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯，而通过阻塞队列来进行通讯，所以生产者生产完数据之后不用等待消费者处理，直接扔给阻塞队列，消费者不找生产者要数据，而是直接从阻塞队列里取，阻塞队列就相当于一个缓冲区，平衡了生产者和消费者的处理能力。

　　　　2、JoinableQueue([maxsize])

　　　　创建可连接的共享进程队列。这就像是一个Queue对象，但队列允许项目的使用者通知生产者项目已经被成功处理。通知进程是使用共享的信号和条件变量来实现的。

JoinableQueue的实例p除了与Queue对象相同的方法之外，还具有以下方法：

q.task_done() 
使用者使用此方法发出信号，表示q.get()返回的项目已经被处理。如果调用此方法的次数大于从队列中删除的项目数量，将引发ValueError异常。

q.join() 
生产者将使用此方法进行阻塞，直到队列中所有项目均被处理。阻塞将持续到为队列中的每个项目均调用q.task_done()方法为止。 
下面的例子说明如何建立永远运行的进程，使用和处理队列上的项目。生产者将项目放入队列，并等待它们被处理。

　　　　代码

from multiprocessing import Process, Queue, JoinableQueue
import time
import random


def producer(name,food,q):
    for i in range(5):
        data = '%s生产了%s%s'%(name,food,i)
        # 模拟延迟
        time.sleep(random.randint(1,3))
        print(data)
        # 将数据放入 队列中
        q.put(data)


def consumer(name,q):
    # 消费者胃口很大 光盘行动
    while True:
        food = q.get()  # 没有数据就会卡住
        # 判断当前是否有结束的标识
        # if food is None:break
        time.sleep(random.randint(1,3))
        print('%s吃了%s'%(name,food))
        q.task_done()  # 告诉队列你已经从里面取出了一个数据并且处理完毕了


if __name__ == '__main__':
    # q = Queue()
    q = JoinableQueue()
    p1 = Process(target=producer,args=('大厨ys','包子',q))
    p2 = Process(target=producer,args=('马叉虫tank','泔水',q))
    c1 = Process(target=consumer,args=('春哥',q))
    c2 = Process(target=consumer,args=('新哥',q))
    p1.start()
    p2.start()
    # 将消费者设置成守护进程
    c1.daemon = True
    c2.daemon = True
    c1.start()
    c2.start()
    p1.join()
    p2.join()
    # 等待生产者生产完毕之后 往队列中添加特定的结束符号
    # q.put(None)  # 肯定在所有生产者生产的数据的末尾
    # q.put(None)  # 肯定在所有生产者生产的数据的末尾
    q.join()  # 等待队列中所有的数据被取完再执行往下执行代码
    """
    JoinableQueue 每当你往该队列中存入数据的时候 内部会有一个计数器+1
    没当你调用task_done的时候 计数器-1
    q.join() 当计数器为0的时候 才往后运行
    """
    # 只要q.join执行完毕 说明消费者已经处理完数据了  消费者就没有存在的必要了