多进程之理论与开启进程的方式

进程和程序的区别

程序

　　程序就是一堆计算机可以识别的文件，程序在没有被运行时就是躺在硬盘上的一堆二进制

　　运行程序时，要从硬盘读取数据到内存中，CPU再从内存中读取指令并执行

进程

　　一旦程序运行就会产生进程

　　一个程序可以多次执行，产生多个进程，但是进程之间时相互独立的

　　当我们右键运行一个py文件时，其实启动的时python解释器，你的py文件其实是当作参数传给了解释器

阻塞非阻塞并行并发 ******

1、阻塞：程序运行时遇到IO操作时就进入了阻塞状态

　　　　本地IO：input　　print　　sleep　　read　　write

　　　　网络IO：recv　　send

2、非阻塞：程序正常运行中，没有任何IO操作，就处于非阻塞状态

## 阻塞非阻塞说的是程序的运行状态

3、并发：多个任务看起来同时在处理，本质上时切换执行，只是速度非常快而已

4、并行：多个任务真正的同时执行，必须具备多核CPU，才可以并行

## 并发并行说的是任务的处理方式

进程的三种状态以及之间的切换

1、运行态：程序正常执行

2、阻塞态：遇到io操作进入阻塞状态

3、就绪态：io执行完毕进入就绪状态，并向cpu发出信息(等待cpu过来执行)

提高进程效率的方法

根本方法就是让程序尽可能处于运行的状态

减少I/O操作或者尽可能多的占用CPU时间

之前学的缓冲区就是用于减少I/O操作，一次多拿点数据，减少拿的次数

进程的创建与销毁

进程的创建

但凡时硬件，就需要有操作系统取管理，只要有操作系统，就有进程的概念，就需要有创建进程的方式，

一些操作系统只为一个应用程序设计，比如自动洗衣机，一旦启动，进程就已经存在

而对于通用系统（跑很多应用程序），需要有系统运行过程中创建或撤销进程的能力，主要分为4种形式创建新的进程

　　--1、系统初始化（就是只有在需要的时候才启动进程，例如web页面滑到对应的界面才唤醒的进程，也称为守护进程）

　　--2、一个进程在运行过程中开启了子进程（例如我们在pycharm中运行py文件开启了python解释器的进程）

　　--3、用户交互式请求，创建新的进程（例如在GUI界面双击某个应用程序）

　　--4、一个批处理作业的初始化(只有在大型机的批处理系统中应用)，现在基本没有了，了解即可　　

创建子进程unix与windows的比较

1、相同点：进程创建后，父进程和子进程有各自不同的地址空间(多道技术要求物理层面实现进程之间内存的隔离)，任何一个进程的在其地址空间中的修改都不会影响到另外一个进程

2、不同点：在unix中，子进程的初始地址空间时父进程的一个副本，但对于windows来说，需要重新加载程序代码，所以需要把创建子进程的一些代码放到自执行的判断中

进程的销毁

1、正常退出（自愿，如用户点击交互式页面的×，或者程序执行完毕调用发起系统调用正常退出）

2、出错退出（自愿， python a.py中 a.py不存在）

3、严重错误（非自愿，执行非法操作时，如引用不存在的内存，可以捕捉异常）

4、被其他进程杀死（非自愿，如kill -9）

python中实现多进程

在一个应用程序中可能会有多个任务需要并发执行，但是对于操作系统而言，一个进程就是一个任务，

当程序执行过程中遇到I/O操作时，操作系统就会把cpu调给其他应用程序，这对于当前应用程序来说效率就降低了

如何让程序既能完成任务又不降低效率，就需要把耗时的操作交给子进程来完成

开启子进程的两种方式

在python中，想要开启子进程，需要用到multiprocessing模块中的Process类

1、直接实例化Process类

from multiprocessing import Process
import time
def task(name):     # 创建函数，里面是需要子进程执行的代码块
    print("子进程  run")
    time.sleep(3)   # 模拟任务需要耗时
    print(name)
    print("子进程  over")

if __name__ == '__main__': # 创建子进程的代码必须放在这个判断下面，因为windows会导入一下这文件
    # target指定的子进程要执行的任务 args里传入的是子进程需要的参数,需要几个传几个
    p = Process(target=task,args=("xxx","sad ")) 
    print("父进程  run")
    p.start()
    time.sleep(2)
    print("父进程  over")
# 运行结果表明，子进程和当前进程看起来是同时执行（并发）

2、继承Process类并且覆盖run方法

from multiprocessing import Process
import time
class MyProcess(Process):   # 继承Process类

    def __init__(self,name): # 想要往子进程里传入参数，必须在__init__函数中加入属性
        super().__init__()
        self.name = name

    def run(self):  # 覆盖Process的run方法，里面放入子进程要执行的代码块
        print("子进程  run")
        time.sleep(1)
        print(self.name)
        time.sleep(1)
        print("子进程  over")

if __name__ == '__main__':
    p = MyProcess("rose")
    print("父进程  run")
    p.start()
    time.sleep(1)
    print("父进程  over")

需要注意的是：

　　1、在windows下开启子进程函数必须放到__main__下面，因为windows在开启子进程时会重新加载所有的代码造成递归创建进程

　　2、第二种方式中，必须将要执行的代码放到run方法中，子进程只会执行run方法，其他一概不管

进程之间的内存空间是隔离的

from multiprocessing import Process
a = 1000
def task():
    global a
    a = 10
    print(a)

if __name__ == '__main__':
    p = Process(target=task)
    p.start()
    print(a)
    # 1000
    # 10    运行结果表明进程间内存时相互隔离的

join方法

from multiprocessing import Process
import time
def task():
    print("子进程  run")
    time.sleep(2)
    print("子进程  over")

if __name__ == '__main__':
    p = Process(target=task)
    p.start()
    p.join()
    print("我是父进程")

    # 子进程  run
    # 子进程  over
    # 我是父进程         结果表明join函数是让父进程等待该子进程运行完之后才继续往下执行

既然join方法是让父进程等待子进程运行结束才执行代码，那么是不是又变成串行了？？？

　　如果你只是开启一个子进程的话，那这样确实变成串行（那你也没必要开子进程了）

　　但如果开启了多个子进程的话，join函数只会让父进程等该子进程运行结束才执行，但是并不会限制其他子进程的执行

from multiprocessing import Process
import time
def task():
    print("子进程  run")
    time.sleep(2)
    print("子进程  over")

if __name__ == '__main__':
    p1 = Process(target=task)
    p2 = Process(target=task)
    p3 = Process(target=task)
    p1.start()
    p2.start()
    p3.start()
    p1.join()
    p2.join()
    p3.join()
    print("我是父进程")
# 结果表明 2 秒之后 3个子进程基本同时(并行)执行完毕，然后父进程继续执行代码

process对象的常用方法

p = Process(target=task)
p.start()  # 向操作系统发送开启进程的指令，需要一定时间
p.join()  # 等待子进程结束，父进程再执行往后的代码
p.terminate()  # 终止进程 也是向操作系统发送指令，需要延迟
print(p.name) # 进程的名称
print(p.is_alive()) # 查看进程是否存活
print(p.pid)  # 查看进程的pid
# 需要注意的是：process对象是惰性的，如果不发送start指令，p对象相当于没有创建

僵尸进程与孤儿进程

孤儿进程

　　指的是，父进程先结束，而子进程还在运行着，由操作系统接管

　　孤儿进程是无害的，并且是由存在的必要性的

　　例如：qq开启的浏览器，qq退出了，浏览器应该继续运行，因为它的任务可能还没有运行结束

僵尸进程

　　僵尸进程指的是，子进程已经结束了，但是操作系统会保存一些进程信息，如PID，运行时间等（证明这个进程开启过），此时，这个进程就成为僵尸进程，占用系统资源

　　僵尸进程如果太多将会占用大量的资源，造成系统无法开启新的进程

　　在Linux中，父进程需要调用wait/waitpid来获取子进程的残留信息，并清理它

　　python会自动回收僵尸进程

posted @ 2019-05-31 15:06 hesujian 阅读(355) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

hesujian