关于pthread_cond_wait使用while循环判断的理解
在Stevens的《Unix 环境高级编程》中第11章线程关于pthread_cond_wait的介绍中有一个生产者-消费者的例子P311,
在进入pthread_cond_wait前使用while进行条件判断,而没有直接使用if,耐人费解!
代码如下: #include <pthread.h> struct msg { struct msg *m_next; /* value...*/ }; struct msg* workq; pthread_cond_t qready = PTHREAD_COND_INITIALIZER; pthread_mutex_t qlock = PTHREAD_MUTEX_INITIALIZER; void process_msg() { struct msg* mp; for (;;) { pthread_mutex_lock(&qlock); while (workq == NULL) { pthread_cond_wait(&qread, &qlock); } mq = workq; workq = mp->m_next; pthread_mutex_unlock(&qlock); /* now process the message mp */ } } void enqueue_msg(struct msg* mp) { pthread_mutex_lock(&qlock); mp->m_next = workq; workq = mp; pthread_mutex_unlock(&qlock); /** 此时另外一个线程在signal之前,执行了process_msg,刚好把mp元素拿走*/ pthread_cond_signal(&qready); /** 此时执行signal, 在pthread_cond_wait等待的线程被唤醒, 但是mp元素已经被另外一个线程拿走,所以,workq还是NULL ,因此需要继续等待*/ }
这里process_msg相当于消费者,enqueue_msg相当于生产者,struct msg* workq作为缓冲队列
解释如下
在process_msg中使用while(workq==NULL)循环判断条件,这里主要是因为在enqueue_msg中unlock之后才唤醒等待
的线程,会出现上述注释出现的情况,造成workq==NULL,因此需要继续等待。
但是如果将pthread_cond_signal移到pthread_mutex_unlock()之前执行,则会避免这种竞争,在unlock
之后,会首先唤醒pthread_cond_wait的线程,进而workq!=NULL总是成立。
pthread_cond_wait返回时无法保证判断式是真是假,因此需要重新判断。因此建议使用while循环进行验证,以便能够容忍这种竞争。
http://yaronspace.cn/blog/archives/1479
还有一种解释如下所示
http://bbs.csdn.net/topics/370094313
我猜应该是这个意思:
假设有两个线程(我就用伪代码了):
//thread 1
while(0<x<10)
pthread_cond_wait();
//thread 2
while(5<x<15)
pthread_cond_wait();
如果某段时间内 x == 8,那么两个线程相继进入等待。
然后,另一个线程3:
修改x:x = 12
if(..) phtread_cond_signal()
那么,虽然线程1、2都被唤醒了,但是,此时线程1仍然不满足while,只有线程1跳出while,
我们假设一种情况线程2线获得了锁,然后发现满足循环条件,之后又有执行pthread_cond_wait()函数,然后阻塞在这儿,并且释放锁!
1,pthread_cond_signal在多处理器上可能同时唤醒多个线程,当你只能让一个线程处理某个任务时,其它被唤醒的线程就需要继续wait,while循环的意义就体现在这里了,而且规范要求pt hread_cond_signal至少唤醒一个pthread_cond_wait上的线程,其实有些实现为了简单在单处理器上也会唤醒多个线程. 2,某些应用,如线程池,pthread_cond_broadcast唤醒全部线程,但我们通常只需要一部分线程去做执行任务,所以其它的线程需要继续wait.所以强烈推荐此处使用while循环. 其实说白了很简单,就是pthread_cond_signal()也可能唤醒多个线程,而如果你同时只允许一个线程访问的话,就必须要使用while来进行条件判断,以保证临界区内只有一个线程在处理