[Python 多线程] Semaphore、BounedeSemaphore (十二)

 

 Semaphore

信号量,信号量对象内部维护一个倒计数器,每一次acquire都会减1,当acquire方法发现计数为0就阻塞请求的线程,直到其它线程对信号量release后,计数大于0,恢复阻塞的线程。

 

方法:

Semaphore(value=1)                            构造方法。value小于0,抛ValueError异常。默认为1。

acquire(blocking=True,timeout=None)  获取信号量,计数器减1,获取成功返回True。

release()                                               释放信号量,计数器加1。

 

计数器永远不会低于0,因为acquire的时候,发现是0,都会被阻塞。

 

 举例:

图书馆有三本书,三本都被借走(acquire)之后,其他人想看,就得等别人还回来(阻塞),有人还回来(release)一本后,就有一个人可以拿到这本书,其他人仍然得等归还。

#Semaphore 信号量,借还
import threading,logging,time
DATEFMT="%H:%M:%S"
FORMAT = "[%(asctime)s]\t [%(threadName)s,%(thread)d] %(message)s"
logging.basicConfig(level=logging.INFO,format=FORMAT,datefmt=DATEFMT)

def work(s:threading.Semaphore):
    logging.info('in sub thread')
    logging.info(s.acquire())
    logging.info('sub thread oevr')

s = threading.Semaphore(3)
logging.info(s.acquire())
logging.info(s.acquire())
logging.info(s.acquire())

threading.Thread(target=work,args=(s,)).start()
time.sleep(2)

logging.info(s.acquire(False))  #不阻塞
logging.info((s.acquire(timeout=3))) #3秒超时会阻塞

logging.info('release')
s.release()


运行结果:
[08:48:43]	 [MainThread,8840] True
[08:48:43]	 [MainThread,8840] True
[08:48:43]	 [MainThread,8840] True
[08:48:43]	 [Thread-1,6212] in sub thread
[08:48:45]	 [MainThread,8840] False
[08:48:48]	 [MainThread,8840] False
[08:48:48]	 [MainThread,8840] release
[08:48:48]	 [Thread-1,6212] True
[08:48:48]	 [Thread-1,6212] sub thread oevr

  这个例子只起了一个线程,如果多起几个,当release还回来的数小于阻塞的线程数时,程序就会一直处于阻塞状态,直到全部relase。

 

 应用举例:

因为资源有限,且开启一个连接成本高,所以,使用连接池。

 

一个简单的连接池(例子):

连接池应该有容量(value总数),也应该工厂方法可以获取连接,能够把不用的连接归还,供其他使用者使用。

#一个简单的连接池
import threading,logging,time
DATEFMT="%H:%M:%S"
FORMAT = "[%(asctime)s]\t [%(threadName)s,%(thread)d] %(message)s"
logging.basicConfig(level=logging.INFO,format=FORMAT,datefmt=DATEFMT)


class Conn:
    def __init__(self,name):
        self.name = name

class Pool:
    def __init__(self,count=3):
        self.count = count
        #连接池容器
        self.pool = [self._connect('conn-{}'.format(x)) for x in range(self.count)]


    def _connect(self,conn_name):
        return Conn(conn_name)

    def get_conn(self):
        # if len(self.pool) > 0:
        return self.pool.pop() #从尾部弹出一个

    def return_conn(self,conn:Conn):
        self.pool.append(conn)

pool = Pool(3)
print(pool.pool)
pool.get_conn()
pool.get_conn()
pool.get_conn()
pool.get_conn() #第4个

print('End Main')

运行结果:
[<__main__.Conn object at 0x00000211BBEBC160>, <__main__.Conn object at 0x00000211BBEBC1D0>, <__main__.Conn object at 0x00000211BBEBC240>]
Traceback (most recent call last):
  File "C:/python/test.py", line 34, in <module>
    pool.get_conn()
  File "C:/python/test.py", line 24, in get_conn
    return self.pool.pop() #从尾部弹出一个
IndexError: pop from empty list

  当连接池中已经没有可用连接时,再获取就会抛异常 IndexError:pop from empty list。

那就加个判断,只在池中连接数量大于0的时候才可以获取连接:

#修改get_conn函数
    def get_conn(self):
        if len(self.pool) > 0:
            return self.pool.pop() #从尾部弹出一个

  这样在连接池为空时,就不会抛异常了。

 

这个连接池的例子如果使用多线程,这个get_conn()方法是线程不安全的,有可能其它线程看到池中还有一个连接,正准备获取,其它线程也看到了,也准备获取连接,就会抛异常。再或者,都在向池中加连接的时候,也可能会多加。

这个问题可以用锁Lock来解决, 在获取连接和加连接时,加锁解锁;也可以使用semaphore信号量来解决。

 

使用信号量对上例进行修改:

#使用semaphore信号量修改连接池
import threading,logging,time,random
DATEFMT="%H:%M:%S"
FORMAT = "[%(asctime)s]\t [%(threadName)s,%(thread)d] %(message)s"
logging.basicConfig(level=logging.INFO,format=FORMAT,datefmt=DATEFMT)


class Conn:
    def __init__(self,name):
        self.name = name

    def __repr__(self):
        return self.name

class Pool:
    def __init__(self,count=3):
        self.count = count
        #连接池容器
        self.pool = [self._connect('conn-{}'.format(x)) for x in range(self.count)]
        self.semaphore = threading.Semaphore(self.count)


    def _connect(self,conn_name):
        #返回一个连接名
        return Conn(conn_name)

    def get_conn(self):
        #从池中拿走一个连接
        # if len(self.pool) > 0:
        self.semaphore.acquire(timeout=5) #-1,获取连接,最大5秒超时时间,与后面随机秒数相对应
        data = self.pool.pop() #从尾部弹出一个
        return data

    def return_conn(self,conn:Conn):
        #向池中添加一个连接
        self.pool.append(conn)
        self.semaphore.release()  # 先加入池中再信号量+1
        return len(self.pool)


pool = Pool(3)

def worker(pool:Pool):
    conn = pool.get_conn()
    logging.info(conn)
    #模拟使用了资源一段时间(随机1-4秒),然后归还
    threading.Event().wait(timeout=random.randint(1,4))
    pool.return_conn(conn)

for i in range(6):
    threading.Thread(target=worker,name="worker-{}".format(i),args=(pool,)).start()

print('End Main')

运行结果:
[10:34:12]	 [worker-0,5264] conn-2
[10:34:12]	 [worker-1,7420] conn-1
[10:34:12]	 [worker-2,2612] conn-0
End Main
[10:34:13]	 [worker-3,3972] conn-1 #归还以后又可以获取连接
[10:34:14]	 [worker-4,8172] conn-2
[10:34:15]	 [worker-5,11192] conn-1

  上例中模拟获取连接以后使用了1-4秒钟,没有拿到资源的最多阻塞5秒钟,当连接使用结束归还后,阻塞的线程就又重新获取到连接。

 

 

问题:

1) 没有使用信号量就release的情况:

import threading

s = threading.Semaphore(3)
print(s.__dict__)




def work(s:threading.Semaphore):
    s.release()

for i in range(3):
    threading.Thread(target=work,args=(s,)).start()
    print(s.__dict__)

运行结果:
{'_cond': <Condition(<unlocked _thread.lock object at 0x00000219202973A0>, 0)>, '_value': 3}
{'_cond': <Condition(<unlocked _thread.lock object at 0x00000219202973A0>, 0)>, '_value': 2}
{'_cond': <Condition(<unlocked _thread.lock object at 0x00000219202973A0>, 0)>, '_value': 3}
{'_cond': <Condition(<unlocked _thread.lock object at 0x00000219202973A0>, 0)>, '_value': 4}
{'_cond': <Condition(<unlocked _thread.lock object at 0x00000219202973A0>, 0)>, '_value': 5}

  没有acquire信号量时,就release的情况,结果导致了信号量的内置倒计数器的值增加,这样就超出了最大值。

 

解决办法:

使用BoundedSemaphore类:

BoundedSemaphore,继承自Semaphore类。边界绑定,有界的信号量,不允许使用release超过初始值的范围,否则,抛ValueError异常。

#BoundedSemaphore边界绑定
import threading

s = threading.BoundedSemaphore(3)
print(s.__dict__)

s.acquire()
print(s.__dict__)

def work(s:threading.BoundedSemaphore):
    s.release()

for i in range(3):
    threading.Thread(target=work,args=(s,)).start()
    print(s.__dict__)

运行结果:
{'_value': 3, '_cond': <Condition(<unlocked _thread.lock object at 0x000001A42DDF73A0>, 0)>, '_initial_value': 3}
{'_value': 2, '_cond': <Condition(<unlocked _thread.lock object at 0x000001A42DDF73A0>, 0)>, '_initial_value': 3}
{'_value': 3, '_cond': <Condition(<unlocked _thread.lock object at 0x000001A42DDF73A0>, 0)>, '_initial_value': 3}
{'_value': 3, '_cond': <Condition(<unlocked _thread.lock object at 0x000001A42DDF73A0>, 0)>, '_initial_value': 3}
{'_value': 3, '_cond': <Condition(<unlocked _thread.lock object at 0x000001A42DDF73A0>, 0)>, '_initial_value': 3}
Exception in thread Thread-2:
Traceback (most recent call last):
  File "C:/python/test.py", line 11, in work
    s.release()
ValueError: Semaphore released too many times

  使用BoundedSemaphore就可以控制不会多归还。

 

posted @ 2017-12-21 11:34  ihoneysec  阅读(1518)  评论(0编辑  收藏  举报