【2020Python修炼记】python并发编程(四)多线程-理论部分

【目录】

一、什么是线程

二、什么是多线程

三、为何要用多线程

四、线程 PK 进程

 

一、什么是线程

# 在传统操作系统中,每个进程有一个地址空间,而且默认就有一个控制线程

# 线程,顾名思义,就是一条流水线工作的过程,一条流水线必须属于一个车间,一个车间的工作过程是一个进程。

车间负责把资源整合到一起,是一个资源单位,而一个车间内至少有一个流水线

流水线的工作需要电源,电源就相当于cpu

所以,进程只是用来把资源集中到一起(进程只是一个资源单位,或者说资源集合),而线程才是cpu上的执行单位

二、什么是多线程

多线程(即多个控制线程)的概念是,在一个进程中存在多个控制线程,多个控制线程共享该进程的地址空间,

相当于一个车间内有多条流水线,都共用一个车间的资源。 

 

 

三、为何要用多线程

多线程指的是,在一个进程中开启多个线程,

简单的讲:如果多个任务共用一块地址空间,那么必须在一个进程内开启多个线程。详细的讲分为4点:

  1. 多线程共享一个进程的地址空间

      2. 线程比进程更轻量级,线程比进程更容易创建、可撤销,在许多操作系统中,创建一个线程比创建一个进程要快10-100倍,在有大量线程需要动态和快速修改时,这一特性很有用

      3. 若多个线程都是cpu密集型的,那么并不能获得性能上的增强,但是如果存在大量的计算和大量的I/O处理,拥有多个线程允许这些活动彼此重叠运行,从而会加快程序执行的速度。

      4. 在多cpu系统中,为了最大限度的利用多核,可以开启多个线程,比开进程开销要小的多。(这一条并不适用于python)

# 计算密集型
from multiprocessing import Process
from threading import Thread
import os,time


def work():
    res = 0
    for i in range(10000000):
        res *= i

if __name__ == '__main__':
    l = []
    print(os.cpu_count())  # 获取当前计算机CPU个数
    start_time = time.time()
    for i in range(12):
        p = Process(target=work)  # 1.4679949283599854
        t = Thread(target=work)  # 5.698534250259399
        t.start()
        # p.start()
        # l.append(p)
        l.append(t)
    for p in l:
        p.join()
    print(time.time()-start_time)
计算密集型
IO密集型

 

四、线程 PK 进程——巧借‘工厂流水线’去理解

1、创建进程的开销要远大于线程

2、进程之间是竞争关系,线程之间是协作关系 

 

 

参考资料:

https://www.cnblogs.com/linhaifeng/articles/7430082.html

 

posted @ 2020-04-25 15:50  bigorangecc  阅读(274)  评论(0编辑  收藏  举报