并发编程 - 进程

并发编程

多道技术（基于单核背景下产生）

　　单道：指的是一条道路走到黑 --> 串行

　　　　串行：a，b需要使用cpu，a先试用，b等待a使用完成后，b才能使用cpu

　　多道：一条道路分配走 --> 并发

　　　　并发：a，b需要使用cpu，a先使用，b等待a，直到a进入“IO或执行时间过长”，a会（切换+保存状态），然后b可以使用cpu，待b执行遇到“IO或执行时间过长”，再将cpu执行权限交给a，直到两个程序结束

　　特点：

　　　　空间上的复用：（*******）

　　　　　　多个程序使用一个cpu

　　　　时间上的复用：（*******）

　　　　　　1.当执行程序遇到IO时，操作系统会将cpu的执行权限剥夺

　　　　　　　　优点：

　　　　　　　　　　cpu的执行效率提高

　　　　　　2.当执行程序遇到执行时间过长时，操作系统会将cpu的执行权限剥夺

　　　　　　　　缺点：

　　　　　　　　　　程序的执行效率低

并发编程 - 进程

1、进程

（1）什么是进程

　　进程是一个资源单位

（2）进程与程序

　　程序：一堆可执行的代码文件

　　进程：执行代码的过程，称之为进程

（3）进程调度（了解）

　　① 先来先服务调度算法

　　　　比如程序 a，b，若a先来，则先让a先服务，待a服务完毕后，b再服务

　　　　缺点：

　　　　　　执行效率低

　　② 短作业优先调度

　　　　执行时间越短，则先调度

　　　　缺点：

　　　　　　导致执行时间长的程序，需要等待所有时间短的程序执行完毕后，才能执行

　　现代操作系统的进程调度算法：时间片轮转法 + 多级反馈队列（知道）

　　③ 时间片轮转法

　　　　比如同时有10个程序需要执行，操作系统会给你10秒，然后时间片轮转法会将10秒分成10等份。

　　④ 多级反馈队列

　　　　1级别队列：优先级最高，先执行此队列中的程序

　　　　2级别队列：优先级以此类推

　　　　3级别队列：...

2、串行、并发与并行

　　串行：类似于单道，相当于同步提交任务

　　并发：在单核（1个cpu）情况下，当执行a，b两个程序时，a先执行，当a遇到IO时，b开始争抢cpu的执行权限，再让b执行。类似于多道，相当于异步提交任务。（看起来像同时运行）

　　并行：在多核（多个cpu）情况下，多个任务同时执行。（他们是真正意义上的同时运行）

3、同步与异步

　　同步与异步指的是 "提交任务的方式"

　　同步（串行）：

　　　　两个a，b程序都要提交并执行，假如a先提交执行，b必须等a执行完成后，b才能提交任务并执行

　　异步（并发）：

　　　　两个a，b程序都要提交并执行，假如a先提交执行，b无需等a执行完成，就可以直接提交任务并执行

4、阻塞与非阻塞

　　阻塞：

　　　　凡是遇到IO操作都会阻塞，进入阻塞态

　　　　IO操作:

　　　　　　input()

　　　　　　output()

　　　　　　time.sleep()

　　　　　　文件的读写

　　　　　　数据的传输

　　非阻塞（不等待）：

　　　　只要不遇到IO阻塞，其他都是非阻塞（比如计算从1到100万的和）

　　IO密集型：很多IO操作

　　计算密集型：很多计算操作

5、进程的三种状态

　　就绪态：

　　　　所有任务提交完成后，都会进入就绪态。（同步和异步）

　　运行态：

　　　　通过进程调用一个任务开始执行，该任务会进入运行态。（非阻塞）

　　　　程序运行时间过长，会将程序返回给就绪态，等待下次调度

　　阻塞态：

　　　　凡是遇到IO操作的任务都会进入阻塞太，待IO操作结束，则阻塞态结束，进入就绪态，等待下次调度

6、进程的两种创建方式（代码）

　　方式1：直接调用Process类

　　例1：

import time
from multiprocessing import Process


def task():    # 任务
    print("start...")
    time.sleep(3)
    print("end...")

if __name__ == '__main__':

    # target=任务(函数地址) ---> 创建一个子进程
    p_obj = Process(target=task)
    # 告诉操作系统去创建一个子进程
    p_obj.start()
    # 告诉主进程，等待子进程结束后，再执行主进程
    p_obj.join()

    print("正在执行当前主进程")

　　执行结果：

start...
end...
正在执行当前主进程

　　例2：

import time
from multiprocessing import Process


def task(name):    # 任务
    print(f"start...{name}的子进程")
    time.sleep(3)
    print(f"end...{name}的子进程")

if __name__ == '__main__':

    # target=任务(函数地址) ---> 创建一个子进程
    # 异步提交3个任务  (3个子进程)
    p_obj1 = Process(target=task, args=("apple", ))
    p_obj2 = Process(target=task, args=("orange", ))
    p_obj3 = Process(target=task, args=("banana", ))
    # 告诉操作系统去创建一个子进程
    p_obj1.start()
    p_obj2.start()
    p_obj3.start()
    # 告诉主进程，等待子进程结束后，再执行主进程
    p_obj1.join()
    p_obj2.join()
    p_obj3.join()

    print("正在执行当前主进程")

　　执行结果：

# apple、orange、banana三个进程同时提交
start...apple的子进程
start...orange的子进程
start...banana的子进程
end...apple的子进程
end...orange的子进程
end...banana的子进程
正在执行当前主进程

　　方式二：继承Process类

import time
from multiprocessing import Process


class MyProcess(Process):

    def run(self):
        print(f"start...{self.name}的子进程")
        time.sleep(3)
        print(f"end...{self.name}的子进程")


if __name__ == '__main__':
    # 定义一个空列表，将所有的子进程放进去并for循环出来告诉主进程先执行子进程
    list1 = []

    # 假设10个进程
    for i in range(10):
        obj = MyProcess()
        # 告诉操作系统去创建一个子进程
        obj.start()
        list1.append(obj)

    for obj in list1:
        # 告诉主进程，等待子进程结束后，再执行主进程
        obj.join()

    print("正在执行当前主进程")

　　执行结果：

# 10个进程同时提交
start...MyProcess-1的子进程
start...MyProcess-2的子进程
start...MyProcess-3的子进程
start...MyProcess-4的子进程
start...MyProcess-5的子进程
start...MyProcess-6的子进程
start...MyProcess-7的子进程
start...MyProcess-8的子进程
start...MyProcess-9的子进程
start...MyProcess-10的子进程
end...MyProcess-1的子进程
end...MyProcess-2的子进程
end...MyProcess-3的子进程
end...MyProcess-4的子进程
end...MyProcess-5的子进程
end...MyProcess-6的子进程
end...MyProcess-7的子进程
end...MyProcess-8的子进程
end...MyProcess-9的子进程
end...MyProcess-10的子进程
正在执行当前主进程

7、问答题

（1）在单核情况下是否可以实现并行？

　　不可以，并行只能在多核情况下实现

（2）阻塞与同步是一样的吗？非阻塞与异步是一样的吗？

　　不一样

　　同步与异步：提交任务的方式

　　阻塞与非阻塞：进程的状态

　　补充：

　　　　异步非阻塞：异步非阻塞可将cpu的利用率最大化！用在通过并发对程序进程操作

8、子进程回收资源的两种方式

　　① join()方法让主进程等待子进程结束，并且回收子进程资源，主进程再结束并回收资源

　　② 主进程 "正常结束" ，子进程与主进程一并被回收资源

9、僵尸进程和孤儿进程（了解）

　　僵尸进程（有坏处，手动解决）：

　　　　在子进程结束后，主进程没有正常结束，子进程PID不会被回收

　　　　缺点：

　　　　　　> 操作系统中的PID号是有限的，如有进程PID号无法正常回收，则会占用PID号

　　　　　　> 资源浪费

　　　　　　> 若PID号满了，则无法创建新的进程

　　孤儿进程（无坏处）：

　　　　在子进程没有结束时，主进程没有 "正常结束" ，子进程会被操作系统中的“孤儿院”回收

　　　　操作系统优化机制（孤儿院）：

　　　　　　当主进程意外终止，操作系统会检测是否有正在运行的子进程，会把它们放入孤儿院中，让操作系统帮你自动回收

# 查看进程pid的两种方法
import time
from multiprocessing import Process
# 第一种：在子进程汇总调用，可以拿到子进程对象.pid可以拿到pid号
from multiprocessing import current_process
# 第二种：在子进程汇总调用，可以拿到子进程对象.pid可以拿到pid号
import os


def task():
    print(f"start..{current_process().pid}")    # 第一种
    time.sleep(3)
    print(f"end..{os.getpid()}")    # 第二种


if __name__ == '__main__':
    p = Process(target=task)
    # 告诉操作系统开启子进程
    p.start()
    # 告诉主进程，等待子进程结束后，再执行主进程
    p.join()

    print("主进程结束...")

　　执行结果：

start..5224
end..5224
主进程结束...

10、守护进程

　　守护进程：当主进程结束时，子进程也必须结束，并回收资源

　　守护进程才能必须在创建子进程（调用p.start()）之前设置

# 守护进程演示
import time
from multiprocessing import Process


def demo(name):
    print(f"start..{name}")
    time.sleep(3)
    print(f"end..{name}")


if __name__ == '__main__':
    p = Process(target=demo, args=("apple",))
    # 守护进程才能必须在调用p.start()之前设置
    p.daemon = True    # 将子进程p设置为守护进程

    # 告诉操作系统开启子进程
    p.start()
    time.sleep(1)
    print("主进程结束...")

　　执行结果：

start..apple
主进程结束...

11、进程间数据是相互隔离的

from multiprocessing import Process


number = 10


def func():
    global number
    number += 10


if __name__ == '__main__':
    p = Process(target=func)
    p.start()

    print(number)    # 10

　　执行结果：

12、多进程互斥锁

　　多进程互斥锁是一把锁，将并行改为串行，牺牲了效率，保证了数据读写正确

　　作用：

　　　　某个进程要更改共享数据时，先将其锁定require，此时资源的状态为“锁定”，其他进程不能更改；直到该进程释放资源release，将资源的状态变成“非锁定”，其他的进程才能再次锁定该资源。进程互斥锁保证了每次只有一个进程进行写入操作，从而保证了多进程情况下数据的正确性。

　　多进程实现并行会造成数据不正确，可以引入互斥锁来避免这种问题（PS：在不使用互斥锁的情况下，假如有10个进程要对一个数据进行修改 -1，正确的结果应该是 -10，但是这10个进程并行同时去对一个数据进行修改，修改的是同一份数据，结果却是 -1，这个时候就出现了数据的不正确；在使用互斥锁的情况下，会将10个进程由并行改为串行，一个一个去对数据进行修改，这样保证每个进程都会对数据修改成功，保证了数据的正确性）

　　例：

　　　　抢票例子：假设有10个用户来查看余票，余票为1张，进行抢票操作

"""
多进程实现并发会造成数据不安全。
"""
from multiprocessing import Process
from multiprocessing import Lock    # 进程互斥锁
import json
import time
import random


# 1.查看余票
def search(name):
    # 1.读取数据
    with open(r"data\orange.json", "r", encoding="utf-8") as f:
        user_dic = json.load(f)
        print(f"用户【{name}】查看的余票为【{user_dic.get('number')}】")


# 2.若有余票，购买成功，票数减少
def buy(name):
    # 读取目录data下的orange.json文件
    with open(r"data\orange.json", "r", encoding="utf-8") as f:
        user_dic = json.load(f)

    if user_dic.get('number') > 0:
        user_dic["number"] -= 1
        # 设置网络延迟，让其他用户同时参与抢票
        time.sleep(random.randint(1, 3))
        # 最先写入数据文件的证明抢到票
        with open(r"data\orange.json", "w", encoding="utf-8") as f:
            json.dump(user_dic, f)
        print(f"用户【{name}】抢票成功")

    else:
        print(f"用户【{name}】抢票失败")


def run(name, lock):
    # 假设有10个用户来查看余票
    search(name)

    lock.acquire()    # 加锁，第一个人抢到票写入文件之后，其他人就不能对文件进行修改
    buy(name)
    lock.release()    # 释放锁


if __name__ == '__main__':
    lock = Lock()
    # 开启多进程：实现并发
    for line in range(10):
        p_obj = Process(target=run, args=(f"谢广坤{line + 1}号", lock))
        p_obj.start()

　　执行结果：

用户【谢广坤1号】查看的余票为【1】
用户【谢广坤2号】查看的余票为【1】
用户【谢广坤3号】查看的余票为【1】
用户【谢广坤4号】查看的余票为【1】
用户【谢广坤6号】查看的余票为【1】
用户【谢广坤5号】查看的余票为【1】
用户【谢广坤7号】查看的余票为【1】
用户【谢广坤8号】查看的余票为【1】
用户【谢广坤9号】查看的余票为【1】
用户【谢广坤10号】查看的余票为【1】
用户【谢广坤1号】抢票成功
用户【谢广坤2号】抢票失败
用户【谢广坤3号】抢票失败
用户【谢广坤4号】抢票失败
用户【谢广坤6号】抢票失败
用户【谢广坤5号】抢票失败
用户【谢广坤7号】抢票失败
用户【谢广坤8号】抢票失败
用户【谢广坤9号】抢票失败
用户【谢广坤10号】抢票失败

13、队列（FIFO）

　　遵循先进先出原则：

　　　　先存放的数据，就先取出来

　　队列相当于一个第三方的管道，可以存放数据

　　队列的三种使用方法：

　　　　第一种：from multiprocessing import Queue # multiprocessing提供的进程队列，先进先出

　　　　第二种：from multiprocessing import JoinableQueue # 基于Queue封装的队列，先进先出

　　　　第三种：import queue # python内置的队列queue，先进先出

补充：

　　队列（FIFO）：先进先出

　　堆栈（FILO）：先进后出

　　应用：让进程之间进行数据交互

　　例：

　　　　第一种方法：multiprocessing提供的进程队列

# 第一种：Queue
from multiprocessing import Queue    # multiprocessing提供的进程队列，先进先出


q_obj1 = Queue(5)    # q_obj1队列对象，最多可存5个数据
# 添加数据到队列中
q_obj1.put("decade")
print("添加第一个")
q_obj1.put("zio")
print("添加第二个")
q_obj1.put("amazon")
print("添加第三个")
q_obj1.put("build")
print("添加第四个")
q_obj1.put("kabuto")
print("添加第五个")

# put()添加第6个时不会提示报错，队列满了，就会进入阻塞
# q_obj1.put("ooo")

# put_nowait()添加第6个时会提示报错
# q_obj1.put_nowait("ooo")


# 从队列中取数据
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())

# .get()取出第6个时不会提示报错，全部取出之后再取，就会进入阻塞
# print(q_obj1.get())
# .get_nowait()取出第6个时会提示报错
# print(q_obj1.get_nowait())

　　执行结果：

添加第一个
添加第二个
添加第三个
添加第四个
添加第五个
decade
zio
amazon
build
kabuto

　　　　第二种方法：基于Queue封装的队列

# 第二种：JoinableQueue
from multiprocessing import JoinableQueue    # 基于Queue封装的队列，先进先出


q_obj1 = JoinableQueue(5)    # q_obj1队列对象，最多可存5个数据
# 添加数据到队列中
q_obj1.put("decade")
print("添加第一个")
q_obj1.put("zio")
print("添加第二个")
q_obj1.put("amazon")
print("添加第三个")
q_obj1.put("build")
print("添加第四个")
q_obj1.put("kabuto")
print("添加第五个")

# put()添加第6个时不会提示报错，队列满了，就会进入阻塞
# q_obj1.put("ooo")

# put_nowait()添加第6个时会提示报错
# q_obj1.put_nowait("ooo")


# 从队列中取数据
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())

# .get()取出第6个时不会提示报错，全部取出之后再取，就会进入阻塞
# print(q_obj1.get())
# .get_nowait()取出第6个时会提示报错
# print(q_obj1.get_nowait())

　　执行结果：

添加第一个
添加第二个
添加第三个
添加第四个
添加第五个
decade
zio
amazon
build
kabuto

　　　　第三种方法：python内置的队列queue

# 第三种：queue
import queue    # python内置的队列，先进先出


q_obj1 = queue.Queue(5)    # q_obj1队列对象，最多可存5个数据
# 添加数据到队列中
q_obj1.put("decade")
print("添加第一个")
q_obj1.put("zio")
print("添加第二个")
q_obj1.put("amazon")
print("添加第三个")
q_obj1.put("build")
print("添加第四个")
q_obj1.put("kabuto")
print("添加第五个")

# put()添加第6个时不会提示报错，队列满了，就会进入阻塞
# q_obj1.put("ooo")

# put_nowait()添加第6个时会提示报错
# q_obj1.put_nowait("ooo")


# 从队列中取数据
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())
print(q_obj1.get())

# .get()取出第6个时不会提示报错，全部取出之后再取，就会进入阻塞
# print(q_obj1.get())
# .get_nowait()取出第6个时会提示报错
# print(q_obj1.get_nowait())

　　执行结果：

添加第一个
添加第二个
添加第三个
添加第四个
添加第五个
decade
zio
amazon
build
kabuto

14、IPC机制（进程间实现通信）

　　使用队列可以使进程之间互相进行通信

　　例：foo和goo两个函数之间进行数据通信

from multiprocessing import Process
from multiprocessing import JoinableQueue
import time


def foo(q):
    x = 100
    q.put(x)    # 向队列中添加数据
    print("foo：添加数据成功！")

    time.sleep(2)    # 遇到IO操作阻塞，执行goo子进程，goo子进程执行完成(无IO操作阻塞的情况下)，继续执行foo子进程
    from_goo = q.get()    # 向队列中取数据
    print(f"foo：从goo中获取到的数据为{from_goo}")


def goo(q):
    from_foo = q.get()    # 向队列中取数据
    print(f"goo：从foo中获取到的数据为{from_foo}")
    q.put(200)    # 向队列中添加数据
    print("goo：添加数据成功！")


if __name__ == '__main__':
    q = JoinableQueue(10)    # 创建队列可添加数据为10个

    # 创建子进程
    p1 = Process(target=foo, args=(q, ))
    p2 = Process(target=goo, args=(q, ))

    # 执行子进程
    p1.start()
    p2.start()

　　执行结果：

foo：添加数据成功！
goo：从foo中获取到的数据为100
goo：添加数据成功！
foo：从goo中获取到的数据为200

15、生产者与消费者

　　生产者：生产数据的

　　消费者：使用数据的

　　问题：供需不平衡

　　通过队列来实现解决供不应求的问题

from multiprocessing import JoinableQueue
from multiprocessing import Process
import time


# 生产者：生产数据添加队列中
def producer(name, food, obj):
    info = f"【{name}】生产了【{food}】食物"
    # 将生产的数据添加队列中
    obj.put(food)
    print(info)


# 消费者
def customer(name, obj):
    while True:
        try:
            time.sleep(0.5)
            # 从队列中取出数据
            food = obj.get_nowait()
            # 若food中数据为None，跳出循环
            if not food:
                break
            info = f"【{name}】吃到了【{food}】食物"
            print(info)

        except Exception:
            break


if __name__ == '__main__':
    obj = JoinableQueue()
    # 创建10个生产者
    for i in range(10):
        p1 = Process(target=producer, args=("Trump", f"thread{i}号", obj))
        p1.start()

    # 创建2个消费者
    c1 = Process(target=customer, args=("abc", obj))
    c2 = Process(target=customer, args=("qwe", obj))

    # 开始执行子程序
    c1.start()
    c2.start()

　　执行结果：

【Trump】生产了【thread0号】食物
【Trump】生产了【thread2号】食物
【Trump】生产了【thread1号】食物
【Trump】生产了【thread3号】食物
【Trump】生产了【thread4号】食物
【Trump】生产了【thread6号】食物
【Trump】生产了【thread5号】食物
【Trump】生产了【thread8号】食物
【Trump】生产了【thread7号】食物
【Trump】生产了【thread9号】食物
【abc】吃到了【thread0号】食物
【qwe】吃到了【thread2号】食物
【abc】吃到了【thread1号】食物
【qwe】吃到了【thread3号】食物
【abc】吃到了【thread4号】食物
【qwe】吃到了【thread6号】食物
【abc】吃到了【thread5号】食物
【qwe】吃到了【thread8号】食物
【abc】吃到了【thread7号】食物
【qwe】吃到了【thread9号】食物

16、补充：创建执行子进程注意点

　　windows系统：

　　　　当创建进程时，会将当前py文件的会由上到下重新执行一次，当执行到创建子进程时，会再一次将当前py文件的会由上到下重新执行一次，依次执行，就会进入死循环，所以在windows系统执行创建子进程时，我们需要将执行代码放在if __name__ == '__main__'中执行。

　　linux系统：

　　　　在linux系统，会直接复制一份代码去执行，无需将执行代码放在if __name__ == '__main__'中执行。

　　PS：创建子进程续注意，子线程无此问题。

from multiprocessing import Process


def task():
    pass


if __name__ == '__main__':
    # 创建子进程
    p = Process(target=task)
    p.start()

posted @ 2020-11-04 22:41 chchcharlie、阅读(243) 评论(0) 编辑收藏举报

刷新页面返回顶部

chchcharlie、

不求便于他人，只求便于自己......

并发编程 - 进程

并发编程

多道技术（基于单核背景下产生）

并发编程 - 进程

1、进程

（1）什么是进程

（2）进程与程序

（3）进程调度（了解）

2、串行、并发与并行

3、同步与异步

4、阻塞与非阻塞

5、进程的三种状态

6、进程的两种创建方式（代码）

7、问答题

（1）在单核情况下是否可以实现并行？

（2）阻塞与同步是一样的吗？非阻塞与异步是一样的吗？

8、子进程回收资源的两种方式

9、僵尸进程和孤儿进程（了解）

10、守护进程

11、进程间数据是相互隔离的

12、多进程互斥锁

13、队列（FIFO）

14、IPC机制（进程间实现通信）

15、生产者与消费者

16、补充：创建执行子进程注意点

公告