Linux：使用互斥量进行线程同步

基础知识

同步概念

所谓同步，即同时起步，协调一致。不同的对象，对"同步"的理解方式略有不同。如，设备同步，是指在两个设备之间规定一个共同的时间参考；数据库同步，是指让两个或多个数据库内容保持一致，或者按需要部分保持一致；文件同步，是指让两个或多个文件夹里的文件保持一致。等等

而，编程中、通信中所说的同步与生活中大家印象中的同步概念略有差异。"同"字应是指协同、协助、互相配合。主旨在协同步调，按预定的先后次序运行。

线程同步

同步即协同步调，按预定的先后次序运行。

线程同步，指一个线程发出某一功能调用时，在没有得到结果之前，该调用不返回。同时其它线程为保证数据一致性，不能调用该功能。

举例1：银行存款 5000。柜台，折：取3000；提款机，卡：取 3000。剩余：2000

举例2：内存中100字节，线程T1欲填入全1，线程T2欲填入全0。但如果T1执行了50个字节失去cpu，T2执行，会将T1写过的内容覆盖。当T1再次获得cpu继续从失去cpu的位置向后写入1，当执行结束，内存中的100字节，既不是全1，也不是全0。

产生的现象叫做"与时间有关的错误"(time related)。为了避免这种数据混乱，线程需要同步。

"同步"的目的，是为了避免数据混乱，解决与时间有关的错误。实际上，不仅线程间需要同步，进程间、信号间等等都需要同步机制。

因此，所有"多个控制流，共同操作一个共享资源"的情况，都需要同步。

数据混乱原因：

资源共享（独享资源则不会）
调度随机（意味着数据访问会出现竞争）
线程间缺乏必要的同步机制。

以上3点中，前两点不能改变，欲提高效率，传递数据，资源必须共享。只要共享资源，就一定会出现竞争。只要存在竞争关系，数据就很容易出现混乱。

所以只能从第三点着手解决。使多个线程在访问共享资源的时候，出现互斥。

互斥量mutex

Linux中提供一把互斥锁mutex（也称之为互斥量）。

每个线程在对资源操作前都尝试先加锁，成功加锁才能操作，操作结束解锁。

资源还是共享的，线程间也还是竞争的，

但通过"锁"就将资源的访问变成互斥操作，而后与时间有关的错误也不会再产生了。

但，应注意：同一时刻，只能有一个线程持有该锁。

当A线程对某个全局变量加锁访问，B在访问前尝试加锁，拿不到锁，B阻塞。C线程不去加锁，而直接访问该全局变量，依然能够访问，但会出现数据混乱。

所以，互斥锁实质上是操作系统提供的一把"建议锁"（又称"协同锁"），建议程序中有多线程访问共享资源的时候使用该机制。但，并没有强制限定。

因此，即使有了mutex，如果有线程不按规则来访问数据，依然会造成数据混乱。

主要应用函数：

pthread_mutex_init函数

pthread_mutex_destroy函数

pthread_mutex_lock函数

pthread_mutex_trylock函数

pthread_mutex_unlock函数

以上5个函数的返回值都是：成功返回0，失败返回错误号。

pthread_mutex_t 类型，其本质是一个结构体。为简化理解，应用时可忽略其实现细节，简单当成整数看待。

pthread_mutex_t mutex; 变量mutex只有两种取值1、0。

pthread_mutex_init函数

初始化一个互斥锁(互斥量) —> 初值可看作1

int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);

参1：传出参数，调用时应传 &mutex

restrict关键字：只用于限制指针，告诉编译器，所有修改该指针指向内存中内容的操作，只能通过本指针完成。不能通过除本指针以外的其他变量或指针修改

参2：互斥量属性。是一个传入参数，通常传NULL，选用默认属性(线程间共享)。参APUE.12.4同步属性

静态初始化：如果互斥锁 mutex 是静态分配的（定义在全局，或加了static关键字修饰），可以直接使用宏进行初始化。g. pthead_mutex_t muetx = PTHREAD_MUTEX_INITIALIZER;
动态初始化：局部变量应采用动态初始化。g. pthread_mutex_init(&mutex, NULL)

pthread_mutex_destroy函数

销毁一个互斥锁；不能忘记销毁

int pthread_mutex_destroy(pthread_mutex_t *mutex);

pthread_mutex_lock函数

加锁。可理解为将mutex –（或-1）

int pthread_mutex_lock(pthread_mutex_t *mutex);

pthread_mutex_unlock函数

解锁。可理解为将mutex ++（或+1）

int pthread_mutex_unlock(pthread_mutex_t *mutex);

pthread_mutex_trylock函数

尝试加锁

int pthread_mutex_trylock(pthread_mutex_t *mutex);

加锁与解锁

lock与unlock：

lock尝试加锁，如果加锁不成功，线程阻塞，阻塞到持有该互斥量的其他线程解锁为止。

unlock主动解锁函数，同时将阻塞在该锁上的所有线程全部唤醒，至于哪个线程先被唤醒，取决于优先级、调度。默认：先阻塞、先唤醒。

例如：T1 T2 T3 T4 使用一把mutex锁。T1加锁成功，其他线程均阻塞，直至T1解锁。T1解锁后，T2 T3 T4均被唤醒，并自动再次尝试加锁。

可假想mutex锁 init成功初值为1。 lock 功能是将mutex–。 unlock将mutex++

lock与trylock：

lock加锁失败会阻塞，等待锁释放。

trylock加锁失败直接返回错误号（如：EBUSY），不阻塞。

加锁测试

先写一个测试程序：由于共享、竞争而没有加任何同步机制，导致产生于时间有关的错误，造成数据混乱的一个例子：

#include <stdio.h>

#include <stdlib.h>

#include <time.h>

#include <pthread.h>

#include <unistd.h>

void *tfn(void *arg)

{

srand(time(NULL));

while (1) {

printf("hello ");

sleep(rand() % 3); /*模拟长时间操作共享资源，导致cpu易主，产生与时间有关的错误*/

printf("world\n");

sleep(rand() % 3);

}

return NULL;

}

int main(void)

{

pthread_t tid;

srand(time(NULL));

pthread_create(&tid, NULL, tfn, NULL);

while (1) {

printf("HELLO ");

sleep(rand() % 3);

printf("WORLD\n");

sleep(rand() % 3);

}

pthread_join(tid, NULL);

return 0;

}

这个程序很简单，输出结果如下：数据是混乱的，显然是不符合我们的预设的。接下来位线程加上锁。其实有了上面的基础知识的说明，用起来还是没有太大的难度的。我先把正确的用法贴出来:

#include <stdio.h>

#include <stdlib.h>

#include <pthread.h>

#include <unistd.h>

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;//定义一个全局锁,并使用宏初始化

void *tfn(void *arg)

{

srand(time(NULL));

while (1) {

pthread_mutex_lock(&mutex);//加锁

srand(time(NULL));

printf("hello ");

sleep(1); /*模拟长时间操作共享资源，导致cpu易主，产生与时间有关的错误*/

printf("world\n");

sleep(1);

pthread_mutex_unlock(&mutex);//解锁

}

return NULL;

}

int main(void)

{

pthread_t tid;

int i = 5;

srand(time(NULL));

pthread_create(&tid, NULL, tfn, NULL);

// pthread_mutex_init(&mutex,NULL);//初始化

while (i–)//控制次数，正确的杀死子线程

{

pthread_mutex_lock(&mutex);//加锁

printf("HELLO ");

sleep(1);

printf("WORLD\n");

sleep(1);

pthread_mutex_unlock(&mutex);//解锁

}

pthread_cancel(tid);//杀死子线程

pthread_join(tid, NULL);

pthread_mutex_destroy(&mutex);//销毁锁

return 0;

}

我第一次加的时候是在每个线程主函数的开头加上解锁和加锁函数，在函数的末尾加上解锁函数。这样是错的，首先第一步不应该加解锁函数，看lock的说明就知道：lock尝试加锁，如果加锁不成功，线程阻塞，阻塞到持有该互斥量的其他线程解锁为止。再者，线程主函数在最后是会自主（不一定）调用unlock函数。先解锁是不必要的。

其次就是，我们的测试程序中间有while结构，如果不在while中加解锁，那么势必会造成谁先抢到cpu谁就一直执行的结果；

接下来看正确的结果：完全ok。

接下来看几种错误情况：

在线程主函数前面和末尾加解锁：结果：造成这种结果是因为main函数先加锁，并且进入while之后就没有解锁，在最后解锁的时候子线程已经被杀死。如果我们在while中方解锁，那么就又会造成数据混乱。因为解锁后就没有机会再次加锁了。同样的结论放在子线程中一样有效。
若是子线程在while中加解锁，父线程同样在最前最后加解锁，那么，结果不用测试就知道：子进程没有机会输出。一个是因为主线程没有解锁，一个是因为主线程比子线程先抢到cpu。子线程要经过一次跳转，父线程不需要。
如果反过来：子线程在最前最后加解锁，父进程在while中加解锁结果又是什么呢？其实我们是能够推算出来的:父线程先抢到cpu（基本上是这样的，但也不绝对，取决于内核的调度），所以父进程先输出HELLO WORLD。然后就没有父线程的事儿了，像这样：直到我手动结束它。这里，虽然父线程先加锁，但是它while一次之后解锁唤醒了子线程，子线程一来就加锁，一头扎入while不出来了。简单的解决方法很多，直接给while加上次数限制就是了。
同样是上面的情况，我们先让子线程抢到cpu，加上sleep，那么结果也显而易见：父线程不会输出，全是子线程输出。

大体上也就这些错误情况，这些错误情况是针对这个测试程序，并没有普遍性。现在我们测试这样的情况：将unlock挪至第二个sleep后。结果是：交替现象很难出现。为什么？

线程在操作完共享资源后本应该立即解锁，但修改后，线程抱着锁睡眠。睡醒解锁后又立即加锁，这两个库函数（加解锁）本身不会阻塞。所以在这两行代码之间失去cpu的概率很小。因此，另外一个线程很难得到加锁的机会。

所以，结论：在访问共享资源前加锁，访问结束后立即解锁。锁的"粒度"应越小越好。

再贴一个自我感觉最优的代码：

#include <stdio.h>

#include <time.h>

#include <stdlib.h>

#include <pthread.h>

#include <unistd.h>

pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;//定义一个全局锁,并使用宏初始化

void *tfn(void *arg)

{

int p_ret;

while (1) {

p_ret = pthread_mutex_lock(&mutex);//加锁

if (p_ret)

puts("加锁失败。");

printf("hello ");

sleep(1); /*模拟长时间操作共享资源，导致cpu易主，产生与时间有关的错误*/

printf("world\n");

p_ret = pthread_mutex_unlock(&mutex);//解锁

if (p_ret)

puts("解锁失败。");

sleep(1);

}

return NULL;

}

int main(void)

{

int p_ret;

pthread_t tid;

int i = 5;

pthread_create(&tid, NULL, tfn, NULL);

// pthread_mutex_init(&mutex,NULL);//初始化

while (i--)

{

p_ret = pthread_mutex_lock(&mutex);//加锁

if (p_ret)

puts("加锁失败。");

printf("HELLO ");

sleep(1);

printf("WORLD\n");

p_ret = pthread_mutex_unlock(&mutex);//解锁

if (p_ret)

puts("加锁失败。");

sleep(1);

}

pthread_cancel(tid);//杀死子线程,子线程自带取消点（dui'a'o'yo调用printf函数，printf函数会调用write等系统调用函数

pthread_join(tid, NULL);

p_ret = pthread_mutex_destroy(&mutex);//销毁锁

if (p_ret)

puts("销毁锁失败。");

return 0;

}

posted on 2018-04-05 20:48 狂自私阅读(238) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

狂自私

导航

统计

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

Linux：使用互斥量进行线程同步