线程基础

线程

1.什么是线程?

线程与进程都是虚拟单位,目的是为了更好的描述某种事物。

进程:资源单位

线程:执行单位

开启一个进程,一定会有一个线程,线程才是真正的执行者

2.为什么要使用线程?

节省内存资源。

2.1开启进程

  1. 开辟一个名称空间,每开启一个进程都会占用一份内存资源。
  2. 会自带一个线程

2.2开启线程

  1. 一个进程可以开启多个线程
  2. 线程的开销远小于进程。

注意:线程不能实现并行,线程只能实现并发,进程可以实现并行。

而且线程之间数据是共享的。

3.GIL全局解释器锁

3.1 GIL是什么?

GIL本质上是一个互斥锁。

3.2 GIL有什么用?

GIL的作用是阻止同一个进程内多个线程同时执行(并行)。

  • 单个进程下的多个进程无法实现并行,但能实现并发。

3.3 为什么要有GIL?

GIL锁可以使内存管理是“数据安全”的。

GIL的存在就是为了保证线程安全。

注意:多个线程过来执行,一旦遇到IO操作,就会立马释放GIL解释器锁,把锁教给下一个线程使用。

4.多线程的作用

不同的任务有不同的特性,有的属于计算密集型,有的属于IO密集型,对于不同的任务而言,使用进程还是使用线程会对CPU的使用效率造成极大的差别。

结论:

  1. 在计算密集型的情况下:

    使用多进程

  2. 在IO密集型的情况下:

    使用多线程

  3. 高效执行多个进程,内多个IO密集型的程序:

    使用 多进程 + 多线程

'''
- 四个任务, 计算密集型, 每个任务需要10s:
        单核:
            - 开启进程
                消耗资源过大
                - 4个进程: 40s

            - 开启线程
                消耗资源远小于进程
                - 4个线程: 40s

        多核:
            - 开启进程
                并行执行,效率比较高
                - 4个进程: 10s

            - 开启线程
                并发执行,执行效率低.
                - 4个线程: 40s



    - 四个任务, IO密集型, 每个任务需要10s:
        单核:
            - 开启进程
                消耗资源过大
                - 4个进程: 40s

            - 开启线程
                消耗资源远小于进程
                - 4个线程: 40s

        多核:
            - 开启进程
                并行执行,效率小于多线程,因为遇到IO会立马切换CPU的执行权限
                - 4个进程: 40s  +  开启进程消耗的额外时间

            - 开启线程
                并发执行,执行效率高于多进程

                - 4个线程: 40s
'''

from threading import Thread
from multiprocessing import Process
import os
import time


# 计算密集型
def work1():
    number = 0
    for line in range(100000000):
        number += 1


# IO密集型
def work2():
    time.sleep(1)


if __name__ == '__main__':

    # 测试计算密集型
    # print(os.cpu_count())  # 6
    # # 开始时间
    # start_time = time.time()
    # list1 = []
    # for line in range(6):
    #     p = Process(target=work1)  # 程序执行时间5.300818920135498
    #     # p = Thread(target=work1)  # 程序执行时间24.000795602798462
    #
    #     list1.append(p)
    #     p.start()

    # IO密集型
    print(os.cpu_count())  # 6
    # 开始时间
    start_time = time.time()
    list1 = []
    for line in range(40):
        # p = Process(target=work2)  # 程序执行时间4.445072174072266
        p = Thread(target=work2)  # 程序执行时间1.009237289428711

        list1.append(p)
        p.start()

    for p in list1:
        p.join()
    end_time = time.time()

    print(f'程序执行时间{end_time - start_time}')

5.死锁现象

两个线程执行任务时,在调用已经被别的线程调用了的全局锁时,会卡住。

6.递归锁

用于解决死锁问题。

RLock:比喻成万能钥匙,可以提供给多个人去使用。

第一次使用时,会对该锁做一个引用计数,只有引用计数为0,才能真正释放这个锁,让另一个人去使用。

7.信号量

互斥锁:同一时间只能让一个人去使用。

信号量:同一时间可以让多个人去使用。

8.线程队列

FIFO队列:先进先出

LIFO队列:后进先出

优先级队列:根据参数内元素的每一个字符排列,按照字符编码的顺序排先后。

posted @ 2019-10-22 19:08  Donner  阅读(116)  评论(0编辑  收藏  举报