python 多线程 和 资源共享

在一个程序中,这些独运行的程序片段叫做“线程”(Thread),利用它编程的概念叫做“多线程处理”。

定义:
     每个正在系统上运行的程序都是一个进程。每个进程包好一到多个线程。进程也可能是整个程序或者是部分程序的动态执行。线程是一组命令的集合,或者是程序的特殊段,他可以在程序里独立执行。也可以把它理解为代码运行的上下文。所以线程基本上是轻量级的进程,他负责在单个程序里执行多任务。通常有操作系统副总多个线程的调度和执行。
     线程是程序中一个单一的顺序控制流程。在单个程序中同时运行多个线程完成不同的工作,称为多线程。
     线程和进程的区别在于,子进程和父进程有不同的代码和数据空间,而多个线程则共享数据空间,每个线程有自己的执行堆栈和程序计数器为其执行上下文。多线程主要是为了节约CPU时间,发挥利用,根据具体情况而定。线程的运作中需要使用计算机的内存资源和CPU。

对于资源,加锁是个重要的环节。因为python原生得list,dict等,都是not thread safe的。而Queue,是线程安全的。
以“生产者-消费者”模型为例

快速生产者 和 慢速消费者:

import threading
import Queue
import random
import time

class consumer(threading.Thread):
    def __init__(self,que):
        threading.Thread.__init__(self)
        self.daemon = False
        self.queue = que
    def run(self):
        while True:
            if self.queue.empty():
                break
            item = self.queue.get()
            #processing the item 
            time.sleep(item)
            print self.name,item
            self.queue.task_done()
        return
que = Queue.Queue()
for x in range(10):
    que.put(random.random() * 10, True, None)
consumers = [consumer(que) for x in range(3)]
 
for c in consumers:
    c.start()
que.join()


慢速生产者 和 快速消费者:

import Queue,threading,time,random

class consumer(threading.Thread):
    def __init__(self,que):
        threading.Thread.__init__(self)
        self.daemon = False
        self.queue = que
    def run(self):
        while True:
            item = self.queue.get()
            if item == None:
                break
            #processing the item 
            print self.name,item
            self.queue.task_done()
        self.queue.task_done()
        return
que = Queue.Queue()
 
consumers = [consumer(que) for x in range(3)]
for c in consumers:
    c.start()
for x in range(10):
    item = random.random() * 10
    time.sleep(item)
    que.put(item, True, None)
 
 
que.put(None)
que.put(None)
que.put(None)
que.join()

 

posted on 2014-01-16 11:27  邓伟  阅读(1521)  评论(0编辑  收藏  举报

导航