python------线程

一、为什么有了进程还要有线程

  进程有很多优点,它提供了多道编程,让我们感觉我们每个人都拥有自己的CPU和其它资源,可以提高计算机的利用率。但进程还存在很多缺陷的,主要体现在:

  1:进程只能在一个时间干一件事,如果想同时干两件事或多件事,进程就无能为力了。

  2:进程在执行的过程中如果阻塞,整个进程就会挂起,即使进程中有些工作不依赖于输入的数据,也将无法执行。

线程的出现就是为了解决进程的缺陷。

进程是资源分配的最小单位,线程是CPU调度的最小单位。

每一个进程中至少有一个线程。

二、线程和进程的区别

  1:地址空间和其它资源(如打开文件):进程间相互独立,同一进程的各线程间共享。某进程内的线程在其它进程不可见。

  2:通信:进程间通信IPC,线程间可以直接读写进程数据段(如全局变量)来进行通信——需要进程同步和互斥手段的辅助,以保证数据的一致性。

  3:调度和切换:线程上下文切换比进程上下文切换要快得多。

  4:在多线程操作系统中,进程不是一个可执行的实体。

三、线程的特点

  1:轻型实体

  2:独立调度和分派的基本单位

  3:共享进程资源

  4:可并发执行

四、用户级线程和内核级线程池

用户级线程和内核级线程池的区别:

  1:内核支持线程是OS内核可感知的,而用户级线程是OS内核不可感知的。

  2:用户级线程的创建、撤消和调度不需要OS内核的支持,是在语言(如Java)这一级处理的;而内核支持线程的创建、撤消和调度都需OS内核提供支持,而且与进程的创建、撤消和调度大体是相同的。

  3:用户级线程执行系统调用指令时将导致其所属进程被中断,而内核支持线程执行系统调用指令时,只导致该线程被中断。

  4:在只有用户级线程的系统内,CPU调度还是以进程为单位,处于运行状态的进程中的多个线程,由用户程序控制线程的轮换运行;在有内核支持线程的系统内,CPU调度则以线程为单位,由OS的线程调度程序负责线程的调度。

  5:用户级线程的程序实体是运行在用户态下的程序,而内核支持线程的程序实体则是可以运行在任何状态下的程序。

 

用户级线程的优缺点:

优点:

  1:线程的调度不需要内核直接参与,控制简单。

  2:可以在不支持线程的操作系统中实现。

  3:创建和销毁线程、线程切换代价等线程管理的代价比内核线程少得多。

  4:允许每个进程定制自己的调度算法,线程管理比较灵活。

  5:线程能够利用的表空间和堆栈空间比内核级线程多。

  6:同一进程中只能同时有一个线程在运行,如果有一个线程使用了系统调用而阻塞,那么整个进程都会被挂起。另外,页面失效也会产生同样的问题。

缺点:资源调度按照进程进行,多个处理机下,同一个进程中的线程只能在同一个处理机下分时复用

 

内核线程的优缺点:

优点:当有多个处理机时,一个进程的多个线程可以同时执行。

缺点:由内核进行调度。

 

五、threading模块

线程的创建

from threading import Thread
import time
def sayhi(name):
    time.sleep(2)
    print('%s say hello' %name)

if __name__ == '__main__':
    t=Thread(target=sayhi,args=('hjm',))
    t.start()
    print('主线程')
创建线程的方式1
from threading import Thread
import time
class Sayhi(Thread):
    def __init__(self,name):
        super().__init__()
        self.name=name
    def run(self):
        time.sleep(2)
        print('%s say hello' % self.name)


if __name__ == '__main__':
    t = Sayhi('hjm')
    t.start()
    print('主线程')
创建线程的方式2

多线程与多进程

from threading import Thread
from multiprocessing import Process
import os

def work():
    print('hello',os.getpid())
if __name__ == '__main__':
    #part1:在主进程下开启多个线程,每个线程都跟主进程的pid一样
    t1=Thread(target=work)
    t2=Thread(target=work)
    t1.start()
    t2.start()
    print('主线程/主进程pid',os.getpid())
    #part2:开多个进程,每个进程都有不同的pid
    p1=Process(target=work)
    p2=Process(target=work)
    p1.start()
    p2.start()
    print('主线程/主进程pid',os.getpid())
多线程与多进程pid的比较
from threading import Thread
from multiprocessing import Process
import os

def work():
    print('hello')

if __name__ == '__main__':
    #在主进程下开启线程
    t=Thread(target=work)
    t.start()
    print('主线程/主进程')
    '''
    打印结果:
    hello
    主线程/主进程
    '''

    #在主进程下开启子进程
    t=Process(target=work)
    t.start()
    print('主线程/主进程')
    '''
    打印结果:
    主线程/主进程
    hello
    '''
开启效率的比较

 Thread实例对象方法:

  isAlive(): 返回线程是否活动的

  getName(): 返回线程名

  setName(): 设置线程名

threading模块提供的一些方法:

  threading.currentThread(): 返回当前的线程变量

  threading.enumerate():返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。

  threading.activeCount():返回正在运行的线程数量,与len(threading.enumerate()) 有相同的结果

 

from threading import Thread
import time
def sayhi(name):
    time.sleep(2)
    print('%s say hello' %name)

if __name__ == '__main__':
    t=Thread(target=sayhi,args=('hjm',))
    t.start()
    t.join()
    print('主线程')
    print(t.is_alive())
    '''
    hjm say hello
    主线程
    False
    '''
join方法

 

六、守护线程

进程和线程都应该遵循:守护XX会等待主XX运行完毕后被销毁。

运行完毕并非终止运行。

 1:对主进程来说,运行完毕指的是主进程代码运行完毕。

 2:对主线程来说,运行完毕指的是主线程所在的进程内所有非守护线程全部运行完毕,主线程才算运行完毕。

from threading import Thread
import time
def sayhi(name):
    time.sleep(2)
    print('%s say hello' %name)

if __name__ == '__main__':
    t=Thread(target=sayhi,args=('hjm',))
    t.setDaemon(True) #必须在t.start()之前设置
    t.start()

    print('主线程')
    print(t.is_alive())
    '''
    主线程
    True
    '''
守护线程例1
from threading import Thread
import time
def foo():
    print(123)
    time.sleep(1)
    print("end123")

def bar():
    print(456)
    time.sleep(3)
    print("end456")


t1=Thread(target=foo)
t2=Thread(target=bar)

t1.daemon=True
t1.start()
t2.start()
print("main-------")

'''
123
456
main-------
end123
end456

'''
守护线程例2

七、锁

同步锁

from threading import Thread
import os,time
def work():
    global n
    temp=n
    time.sleep(0.1)
    n=temp-1
if __name__ == '__main__':
    n=100
    l=[]
    for i in range(100):
        p=Thread(target=work)
        l.append(p)
        p.start()
    for p in l:
        p.join()

    print(n) #结果可能为99
多个线程抢占资源的情况
from threading import Thread,Lock
import os,time
def work():
    global n
    lock.acquire()
    temp=n
    time.sleep(0.1)
    n=temp-1
    lock.release()
if __name__ == '__main__':
    lock=Lock()
    n=100
    l=[]
    for i in range(100):
        p=Thread(target=work)
        l.append(p)
        p.start()
    for p in l:
        p.join()

    print(n) #结果肯定为0,由原来的并发执行变成串行,牺牲了执行效率保证了数据安全
同步锁的引用
#不加锁:并发执行,速度快,数据不安全
from threading import current_thread,Thread,Lock
import os,time
def task():
    global n
    print('%s is running' %current_thread().getName())
    temp=n
    time.sleep(0.5)
    n=temp-1


if __name__ == '__main__':
    n=100
    lock=Lock()
    threads=[]
    start_time=time.time()
    for i in range(100):
        t=Thread(target=task)
        threads.append(t)
        t.start()
    for t in threads:
        t.join()

    stop_time=time.time()
    print('主:%s n:%s' %(stop_time-start_time,n))

'''
Thread-1 is running
Thread-2 is running
......
Thread-100 is running
主:0.5154428482055664 n:99
'''
互斥锁与join的区别

死锁和递归锁

进程和线程都有死锁和递归锁

死锁: 是指两个或两个以上的进程或线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作用,它们都将无法推进下去。此时称系统处于死锁状态或系统产生了死锁,这些永远在互相等待的进程称为死锁进程

from threading import Lock
from threading import Thread
import time
kz = Lock()  #筷子锁
m = Lock()  #面锁

def eat(name):
    kz.acquire()
    print('%s拿到筷子了'%name)
    m.acquire()
    print('%s拿到面了'%name)
    print('%s吃面'%name)
    m.release()
    kz.release()

def eat2(name):
    m.acquire()
    print('%s拿到面了' % name)
    time.sleep(1)
    kz.acquire()
    print('%s拿到筷子了' % name)
    print('%s吃面' % name)
    kz.release()
    m.release()
Thread(target=eat,args=('张三',)).start()
Thread(target=eat2,args=('李四',)).start()
Thread(target=eat,args=('王五',)).start()
Thread(target=eat2,args=('马六',)).start()

'''
张三拿到筷子了
张三拿到面了
张三吃面
李四拿到面了
王五拿到筷子了
'''
死锁

递归锁可以解决死锁带来的问题。

from threading import RLock
from threading import Thread
import time
kz = m = RLock()  #筷子锁,面锁

def eat(name):
    kz.acquire()
    print('%s拿到筷子了'%name)
    m.acquire()
    print('%s拿到面了'%name)
    print('%s吃面'%name)
    m.release()
    kz.release()

def eat2(name):
    m.acquire()
    print('%s拿到面了' % name)
    time.sleep(1)
    kz.acquire()
    print('%s拿到筷子了' % name)
    print('%s吃面' % name)
    kz.release()
    m.release()
Thread(target=eat,args=('张三',)).start()
Thread(target=eat2,args=('李四',)).start()
Thread(target=eat,args=('王五',)).start()
Thread(target=eat2,args=('马六',)).start()
递归锁

八、信号量

信号量和线程池有什么区别?

 相同点:在信号量acquire之后,和线程池一样,同时执行的只能有n个

 不同点:开的线程数不一样,对于线程池来说,假设一直就只开5个线程,信号量有几个任务就开几个线程

from threading import Semaphore
from threading  import Thread
import time
import random
def func(n,sem):
    sem.acquire()
    print('thread -%s start'%n)
    time.sleep(random.randint(1,3))
    print('thread -%s done' % n)
    sem.release()
sem = Semaphore(5)  #一把锁有5把钥匙
for i in range(20):
    Thread(target=func,args=(i,sem)).start()
信号量

九、事件

事件的方法:

 event.isSet():返回event的状态值;

 event.wait():如果 event.isSet()==False将阻塞线程;

 event.set(): 设置event的状态值为True,所有阻塞池的线程激活进入就绪状态, 等待操作系统调度;

 event.clear():恢复event的状态值为False。

import time
import random
from threading import Event
from threading import Thread
def conn_mysql():  # 连接数据库
    count = 1
    while not e.is_set():  # 当事件的flag为False时才执行循环内的语句
        if count>3:
            raise TimeoutError
        print('尝试连接第%s次'%count)
        count += 1
        e.wait(0.5)  # 一直阻塞变成了只阻塞0.5
    print('连接成功')  # 收到check_conn函数内的set指令,让flag变为True跳出while循环,执行本句代码

def check_conn():
    '''
    检测数据库服务器的连接是否正常
    '''
    time.sleep(random.randint(1,2))  # 模拟连接检测的时间
    e.set() # 告诉事件的标志数据库可以连接

e = Event()
check = Thread(target=check_conn)
check.start()
conn = Thread(target=conn_mysql)
conn.start()
Event

十、条件

使得线程等待,只有满足某条件时,才释放n个线程

import threading
def run(n):
    con.acquire()
    con.wait()  # 等着
    print("run the thread: %s" % n)
    con.release()

if __name__ == '__main__':
    con = threading.Condition()   # 条件  = 锁 + wait的功能
    for i in range(10):
        t = threading.Thread(target=run, args=(i,))
        t.start()

    while True:
        inp = input('>>>')
        if inp == 'q':
            break
        con.acquire()        # condition中的锁 是 递归锁
        if inp == 'all':
            con.notify_all()
        else:
            con.notify(int(inp))   # 传递信号 notify(1) --> 可以放行一个线程
        con.release()
条件

十一、定时器

定时器:指定n秒后执行某个操作

import threading
def run(n):
    con.acquire()
    con.wait()  # 等着
    print("run the thread: %s" % n)
    con.release()

if __name__ == '__main__':
    con = threading.Condition()   # 条件  = 锁 + wait的功能
    for i in range(10):
        t = threading.Thread(target=run, args=(i,))
        t.start()

    while True:
        inp = input('>>>')
        if inp == 'q':
            break
        con.acquire()
        con.notify(int(inp))   # 传递信号 notify(1) --> 可以放行一个线程
        con.release()
        print('****')
定时器

十二、线程队列

LifoQueue后进先出
import queue
q=queue.Queue()
q.put('first')
q.put('second')
q.put('third')

print(q.get())
print(q.get())
print(q.get())
'''
结果(先进先出):
first
second
third
'''
queue.Queue()先进先出
import queue
pq = queue.PriorityQueue()  # 值越小越优先,值相同就asc码小的先出
pq.put((1,'z'))
pq.put((1,'b'))
pq.put((15,'c'))
pq.put((2,'d'))

print(pq.get())
print(pq.get())
print(pq.get())

'''
(1, 'b')
(1, 'z')
(2, 'd')
'''
queue.PriorityQueue() 存储数据时可设置优先级的队列

十三、concurrent.futures

#1 介绍
concurrent.futures模块提供了高度封装的异步调用接口
ThreadPoolExecutor:线程池,提供异步调用
ProcessPoolExecutor: 进程池,提供异步调用
Both implement the same interface, which is defined by the abstract Executor class.

#2 基本方法
#submit(fn, *args, **kwargs)
异步提交任务

#map(func, *iterables, timeout=None, chunksize=1) 
取代for循环submit的操作

#shutdown(wait=True) 
相当于进程池的pool.close()+pool.join()操作
wait=True,等待池内所有任务执行完毕回收完资源后才继续
wait=False,立即返回,并不会等待池内的任务执行完毕
但不管wait参数为何值,整个程序都会等到所有任务执行完毕
submit和map必须在shutdown之前

#result(timeout=None)
取得结果

#add_done_callback(fn)
回调函数
介绍与基本方法
开启线程需要成本,成本比开启进程要低
高IO的情况下,开多线程
所以我们也不能开启任意多个线程
futures.ThreadPoolExecutor  # 线程池
futures.ProcessPoolExecutor  # 进程池
import time
import random
from concurrent import futures
def funcname(n):
    print(n)
    time.sleep(random.randint(1,3))
    return n * '*'
thread_pool = futures.ThreadPoolExecutor(5)
futures.ThreadPoolExecutor()
from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor

import os,time,random
def task(n):
    print('%s is runing' %os.getpid())
    time.sleep(random.randint(1,3))
    return n**2

if __name__ == '__main__':

    executor=ProcessPoolExecutor(max_workers=3)

    futures=[]
    for i in range(11):
        future=executor.submit(task,i)
        futures.append(future)
    executor.shutdown(True)
    print('+++>')
    for future in futures:
        print(future.result())
ProcessPoolExecutor
import time
import random
from concurrent import futures
def funcname(n):
    print(n)
    time.sleep(random.randint(1,3))
    return n * '*'
thread_pool = futures.ThreadPoolExecutor(5)
thread_pool.map(funcname,range(10))  # map,天生异步,接收可迭代对象的数据,不支持返回值
map的用法

 


 

   

 

posted @ 2018-02-06 16:16  笨笨侠  阅读(147)  评论(0编辑  收藏  举报