python 多线程 和 资源共享
在一个程序中,这些独运行的程序片段叫做“线程”(Thread),利用它编程的概念叫做“多线程处理”。
定义:
每个正在系统上运行的程序都是一个进程。每个进程包好一到多个线程。进程也可能是整个程序或者是部分程序的动态执行。线程是一组命令的集合,或者是程序的特殊段,他可以在程序里独立执行。也可以把它理解为代码运行的上下文。所以线程基本上是轻量级的进程,他负责在单个程序里执行多任务。通常有操作系统副总多个线程的调度和执行。
线程是程序中一个单一的顺序控制流程。在单个程序中同时运行多个线程完成不同的工作,称为多线程。
线程和进程的区别在于,子进程和父进程有不同的代码和数据空间,而多个线程则共享数据空间,每个线程有自己的执行堆栈和程序计数器为其执行上下文。多线程主要是为了节约CPU时间,发挥利用,根据具体情况而定。线程的运作中需要使用计算机的内存资源和CPU。
对于资源,加锁是个重要的环节。因为python原生得list,dict等,都是not thread safe的。而Queue,是线程安全的。
以“生产者-消费者”模型为例
快速生产者 和 慢速消费者:
import threading import Queue import random import time class consumer(threading.Thread): def __init__(self,que): threading.Thread.__init__(self) self.daemon = False self.queue = que def run(self): while True: if self.queue.empty(): break item = self.queue.get() #processing the item time.sleep(item) print self.name,item self.queue.task_done() return que = Queue.Queue() for x in range(10): que.put(random.random() * 10, True, None) consumers = [consumer(que) for x in range(3)] for c in consumers: c.start() que.join()
慢速生产者 和 快速消费者:
import Queue,threading,time,random class consumer(threading.Thread): def __init__(self,que): threading.Thread.__init__(self) self.daemon = False self.queue = que def run(self): while True: item = self.queue.get() if item == None: break #processing the item print self.name,item self.queue.task_done() self.queue.task_done() return que = Queue.Queue() consumers = [consumer(que) for x in range(3)] for c in consumers: c.start() for x in range(10): item = random.random() * 10 time.sleep(item) que.put(item, True, None) que.put(None) que.put(None) que.put(None) que.join()