异步同步、阻塞非阻塞、异步回调、线程队列和协程

　　今天学习了异步同步、阻塞非阻塞、异步回调、线程队列和协程

　　一、异步同步和阻塞非阻塞

　　线程的三种状态：

　　　　1、就绪

　　　　2、运行

　　　　3、阻塞

　　阻塞：遇到了IO操作代码卡住无法执行下一行 CPU会切换到其他任务

　　非阻塞：与阻塞相反代码正在执行(运行状态) 或处于就绪状态

　　阻塞和非阻塞描述的是运行的状态

　　同步：提交任务必须等待任务完成，才能执行下一行

　　异步：提交任务不需要等待任务完成，立即执行下一行

　　指的是一种提交任务的方式

　　二、异步回调

　　　　为什么回调：子进程帮助主进程完成任务　处理任务的结果应该交还给主进程
　　　　其他方式也可以将数据交还给主进程

　　　　　　1、shutdown 主进程会等到所有任务完成

　　　　　　2、result函数会阻塞直到任务完成

　　　　注意：

　　　　　　回调函数什么时候被执行？子进程完成时

　　　　　　谁在执行回调函数？主进程

　　　　线程的异步回调

　　　　　　使用方式都相同唯一的不同是执行回调函数是子线程在执行

#进程利用回调完成生产者消费者
from concurrent.futures import ProcessPoolExecutor
import os
pool = ProcessPoolExecutor()

#爬虫 从网络某个地址获取一个HTML文件
import requests    #该模块用于网络请求
#生产数据
def get_data_task(url):
    print(os.getpid(),'正在生产数据！')
    response = requests.get(url)
    text = response.content.decode('utf-8')
    return text

#处理数据
def parser_data(f):
    print(os.getpid(),'处理数据')
    print('正在解析：长度%s'%len(f.result()))

urls = [
'http://www.baidu.com',
'http://www.baidu.com',
'http://www.baidu.com',
'http://www.baidu.com'
]

if __name__ == '__main__':
    for url in urls:
        f = pool.submit(get_data_task,url)
        f.add_done_callback(parser_data)    #回调函数是主进程在执行
        #因为子进程是负责获取数据的  然而数据怎么处理 子进程并不知道
         应该把数据还给主进程
    print('over')

#线程利用回调完成生产者消费者
from concurrent.futures import ThreadPoolExecutor
from threading import current_thread

pool = ThreadPoolExecutor
#爬虫  从网络某个地址获取一个HTML文件
import requests    #该模块用于网络(HTTP)请求
#生产数据
def get_data_task(url):
    print(current_thread(),'正在生产数据！')
    response = requests.get(url)
    text = response.content.decode('utf-8')
    return text

#处理数据
def parser_data(f):
    print(current_thread(),'处理数据')
    print('正在解析：长度%s'%len(f.result()))

urls = [
'http://www.baidu.com',
'http://www,baidu.com',
'http://www.baidu.com',
'http://www.baidu.com'
]

if __name__ =='__main__':
    for url in urls:
        f = pool.submit(get_data_task,url)
        f.add_done_callback(parser_data)    #因为是子线程在执行回调函数 所以没有主次之分 任何子线程都可以对函数进行回调
    print('over')

　　三、线程队列

import queue
#普通队列 先进先出
q = queue.Queue()
q.put('a')
q.put('b')
print(q.get())
print(q.get())

#堆栈队列  先进后出  函数调用就是进栈  函数结束就出栈  递归造成栈溢出
q2 = queue.LifoQueue()
q2.put('a')
q2.put('b')
print('q2.get()')

#优先级队列
q3 = queue.PriorityQueue()    #数值越小优先级越高  优先级相同时  比较大小 小的先取
q3.put((-100,'c'))
q3.put((1,'a'))
q3.put((100,b))
print(q3.get())

　　四、协程

　　　　协程的目的是在单线程下实现并发

　　　　单线程下实现并发将io阻塞时间用于执行计算可以提高效率原理：一直使用CPU直到超时

　　　　怎么实现单线程并发？

　　　　并发指的是看起来像是同时运行实际是在任务间来回切换同时需要保存执行的状态

　　　　任务是一堆代码可以用函数装起来

　　　　1.如何让两个函数切换执行

　　　　　　yield可以保存函数的执行状态

　　　　　　通过生成器可以实现伪并发

　　　　　　并发不一定提升效率反而会降低效率当任务全是计算时

　　　　2.如何知道发生了io？从而切换执行

　　　　　　目前咱们实现不了。。

　　　　第三方模块 greenlet 可以实现并发但是不能检测io

　　　　第三方模块 gevent 封装greenlet 可以实现单线程并发并且能够检测io操作自动切换

#用yield实现两个函数切换执行
import time
def task():
    while True:
        print('task1')
        time.sleep(4)
        yield 1

def task2():
    g = task()
    while True:
        try:
            print('task2')
            next(g)
        except Exception:
            print('任务完成')
            break
task2()

#使用greenlet模块实现并发
import greenlet
import time
def task1():
    print('task1 1')
    time.sleep(2)
    g2.switch()
    print('task1 2')
    g2.swith()

def task2():
    print('task2 1')
    g1.switch()
    print('task2 2')

g1 = greenlet.greenlet(task1)
g2 = greenlet.greenlte(task2)
g1.switch()
#1.实例化greenlet得到一个对象 传入要执行的任务
#2.先让某个任务执行起来 使用对象调用switch
#3.在任务的执行过程中 手动调用switch来切换

#使用gevent模块实现单线程的并发
from gevent import monkey
monkey.patch_all()
import gevent
import time
def eat():
    print('eat food 1')
    time.sleep(2)
    print('eat food 2')

def play():
    print('play 1')
    time.sleep(1)
    print('play 2')

g1 = gevent.spawn(eat)
g2 = gevent.spawn(play)
gevent.joinall([g1,g2])
print('主')

#1.spawn函数传入你的任务
#2.调用join 去开启任务
#3.检测io操作需要打mokey补丁  就是一个函数  在程序最开始的地方调用它

posted @ 2018-11-13 19:13 小菜鸟张阳阳阅读(406) 评论(0) 收藏举报

刷新页面返回顶部

小菜鸟张阳阳

异步同步、阻塞非阻塞、异步回调、线程队列和协程

公告