Linux:使用互斥量进行线程同步
基础知识
同步概念
所谓同步,即同时起步,协调一致。不同的对象,对"同步"的理解方式略有不同。如,设备同步,是指在两个设备之间规定一个共同的时间参考;数据库同步,是指让两个或多个数据库内容保持一致,或者按需要部分保持一致;文件同步,是指让两个或多个文件夹里的文件保持一致。等等
而,编程中、通信中所说的同步与生活中大家印象中的同步概念略有差异。"同"字应是指协同、协助、互相配合。主旨在协同步调,按预定的先后次序运行。
线程同步
同步即协同步调,按预定的先后次序运行。
线程同步,指一个线程发出某一功能调用时,在没有得到结果之前,该调用不返回。同时其它线程为保证数据一致性,不能调用该功能。
举例1: 银行存款 5000。柜台,折:取3000;提款机,卡:取 3000。剩余:2000
举例2: 内存中100字节,线程T1欲填入全1, 线程T2欲填入全0。但如果T1执行了50个字节失去cpu,T2执行,会将T1写过的内容覆盖。当T1再次获得cpu继续 从失去cpu的位置向后写入1,当执行结束,内存中的100字节,既不是全1,也不是全0。
产生的现象叫做"与时间有关的错误"(time related)。为了避免这种数据混乱,线程需要同步。
"同步"的目的,是为了避免数据混乱,解决与时间有关的错误。实际上,不仅线程间需要同步,进程间、信号间等等都需要同步机制。
因此,所有"多个控制流,共同操作一个共享资源"的情况,都需要同步。
数据混乱原因:
- 资源共享(独享资源则不会)
- 调度随机(意味着数据访问会出现竞争)
- 线程间缺乏必要的同步机制。
以上3点中,前两点不能改变,欲提高效率,传递数据,资源必须共享。只要共享资源,就一定会出现竞争。只要存在竞争关系,数据就很容易出现混乱。
所以只能从第三点着手解决。使多个线程在访问共享资源的时候,出现互斥。
互斥量mutex
Linux中提供一把互斥锁mutex(也称之为互斥量)。
每个线程在对资源操作前都尝试先加锁,成功加锁才能操作,操作结束解锁。
资源还是共享的,线程间也还是竞争的,
但通过"锁"就将资源的访问变成互斥操作,而后与时间有关的错误也不会再产生了。
但,应注意:同一时刻,只能有一个线程持有该锁。
当A线程对某个全局变量加锁访问,B在访问前尝试加锁,拿不到锁,B阻塞。C线程不去加锁,而直接访问该全局变量,依然能够访问,但会出现数据混乱。
所以,互斥锁实质上是操作系统提供的一把"建议锁"(又称"协同锁"),建议程序中有多线程访问共享资源的时候使用该机制。但,并没有强制限定。
因此,即使有了mutex,如果有线程不按规则来访问数据,依然会造成数据混乱。
主要应用函数:
pthread_mutex_init函数
pthread_mutex_destroy函数
pthread_mutex_lock函数
pthread_mutex_trylock函数
pthread_mutex_unlock函数
以上5个函数的返回值都是:成功返回0, 失败返回错误号。
pthread_mutex_t 类型,其本质是一个结构体。为简化理解,应用时可忽略其实现细节,简单当成整数看待。
pthread_mutex_t mutex; 变量mutex只有两种取值1、0。
pthread_mutex_init函数
初始化一个互斥锁(互斥量) —> 初值可看作1
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
参1:传出参数,调用时应传 &mutex
restrict关键字:只用于限制指针,告诉编译器,所有修改该指针指向内存中内容的操作,只能通过本指针完成。不能通过除本指针以外的其他变量或指针修改
参2:互斥量属性。是一个传入参数,通常传NULL,选用默认属性(线程间共享)。 参APUE.12.4同步属性
- 静态初始化:如果互斥锁 mutex 是静态分配的(定义在全局,或加了static关键字修饰),可以直接使用宏进行初始化。g. pthead_mutex_t muetx = PTHREAD_MUTEX_INITIALIZER;
- 动态初始化:局部变量应采用动态初始化。g. pthread_mutex_init(&mutex, NULL)
pthread_mutex_destroy函数
销毁一个互斥锁;不能忘记销毁
int pthread_mutex_destroy(pthread_mutex_t *mutex);
pthread_mutex_lock函数
加锁。可理解为将mutex –(或-1)
int pthread_mutex_lock(pthread_mutex_t *mutex);
pthread_mutex_unlock函数
解锁。可理解为将mutex ++(或+1)
int pthread_mutex_unlock(pthread_mutex_t *mutex);
pthread_mutex_trylock函数
尝试加锁
int pthread_mutex_trylock(pthread_mutex_t *mutex);
加锁与解锁
lock与unlock:
lock尝试加锁,如果加锁不成功,线程阻塞,阻塞到持有该互斥量的其他线程解锁为止。
unlock主动解锁函数,同时将阻塞在该锁上的所有线程全部唤醒,至于哪个线程先被唤醒,取决于优先级、调度。默认:先阻塞、先唤醒。
例如:T1 T2 T3 T4 使用一把mutex锁。T1加锁成功,其他线程均阻塞,直至T1解锁。T1解锁后,T2 T3 T4均被唤醒,并自动再次尝试加锁。
可假想mutex锁 init成功初值为1。 lock 功能是将mutex–。 unlock将mutex++
lock与trylock:
lock加锁失败会阻塞,等待锁释放。
trylock加锁失败直接返回错误号(如:EBUSY),不阻塞。
加锁测试
先写一个测试程序:由于共享、竞争而没有加任何同步机制,导致产生于时间有关的错误,造成数据混乱的一个例子:
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <pthread.h>
#include <unistd.h>
void *tfn(void *arg)
{
srand(time(NULL));
while (1) {
printf("hello ");
sleep(rand() % 3); /*模拟长时间操作共享资源,导致cpu易主,产生与时间有关的错误*/
printf("world\n");
sleep(rand() % 3);
}
return NULL;
}
int main(void)
{
pthread_t tid;
srand(time(NULL));
pthread_create(&tid, NULL, tfn, NULL);
while (1) {
printf("HELLO ");
sleep(rand() % 3);
printf("WORLD\n");
sleep(rand() % 3);
}
pthread_join(tid, NULL);
return 0;
}
这个程序很简单,输出结果如下:数据是混乱的,显然是不符合我们的预设的。接下来位线程加上锁。其实有了上面的基础知识的说明,用起来还是没有太大的难度的。我先把正确的用法贴出来:
#include <stdio.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;//定义一个全局锁,并使用宏初始化
void *tfn(void *arg)
{
srand(time(NULL));
while (1) {
pthread_mutex_lock(&mutex);//加锁
srand(time(NULL));
printf("hello ");
sleep(1); /*模拟长时间操作共享资源,导致cpu易主,产生与时间有关的错误*/
printf("world\n");
sleep(1);
pthread_mutex_unlock(&mutex);//解锁
}
return NULL;
}
int main(void)
{
pthread_t tid;
int i = 5;
srand(time(NULL));
pthread_create(&tid, NULL, tfn, NULL);
// pthread_mutex_init(&mutex,NULL);//初始化
while (i–)//控制次数,正确的杀死子线程
{
pthread_mutex_lock(&mutex);//加锁
printf("HELLO ");
sleep(1);
printf("WORLD\n");
sleep(1);
pthread_mutex_unlock(&mutex);//解锁
}
pthread_cancel(tid);//杀死子线程
pthread_join(tid, NULL);
pthread_mutex_destroy(&mutex);//销毁锁
return 0;
}
我第一次加的时候是在每个线程主函数的开头加上解锁和加锁函数,在函数的末尾加上解锁函数。这样是错的,首先第一步不应该加解锁函数,看lock的说明就知道:lock尝试加锁,如果加锁不成功,线程阻塞,阻塞到持有该互斥量的其他线程解锁为止。再者,线程主函数在最后是会自主(不一定)调用unlock函数。先解锁是不必要的。
其次就是,我们的测试程序中间有while结构,如果不在while中加解锁,那么势必会造成谁先抢到cpu谁就一直执行的结果;
接下来看正确的结果:完全ok。
接下来看几种错误情况:
- 在线程主函数前面和末尾加解锁:
结果:
造成这种结果是因为main函数先加锁,并且进入while之后就没有解锁,在最后解锁的时候子线程已经被杀死。如果我们在while中方解锁,那么就又会造成数据混乱。因为解锁后就没有机会再次加锁了。同样的结论放在子线程中一样有效。
- 若是子线程在while中加解锁,父线程同样在最前最后加解锁,那么,结果不用测试就知道:子进程没有机会输出。一个是因为主线程没有解锁,一个是因为主线程比子线程先抢到cpu。子线程要经过一次跳转,父线程不需要。
- 如果反过来:子线程在最前最后加解锁,父进程在while中加解锁结果又是什么呢?其实我们是能够推算出来的:父线程先抢到cpu(基本上是这样的,但也不绝对,取决于内核的调度),所以父进程先输出HELLO WORLD。然后就没有父线程的事儿了,像这样:
直到我手动结束它。这里,虽然父线程先加锁,但是它while一次之后解锁唤醒了子线程,子线程一来就加锁,一头扎入while不出来了。简单的解决方法很多,直接给while加上次数限制就是了。
- 同样是上面的情况,我们先让子线程抢到cpu,加上sleep,那么结果也显而易见:父线程不会输出,全是子线程输出。
大体上也就这些错误情况,这些错误情况是针对这个测试程序,并没有普遍性。现在我们测试这样的情况:将unlock挪至第二个sleep后。结果是:交替现象很难出现。为什么?
线程在操作完共享资源后本应该立即解锁,但修改后,线程抱着锁睡眠。睡醒解锁后又立即加锁,这两个库函数(加解锁)本身不会阻塞。所以在这两行代码之间失去cpu的概率很小。因此,另外一个线程很难得到加锁的机会。
所以,结论:在访问共享资源前加锁,访问结束后立即解锁。锁的"粒度"应越小越好。
再贴一个自我感觉最优的代码:
#include <stdio.h>
#include <time.h>
#include <stdlib.h>
#include <pthread.h>
#include <unistd.h>
pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;//定义一个全局锁,并使用宏初始化
void *tfn(void *arg)
{
int p_ret;
while (1) {
p_ret = pthread_mutex_lock(&mutex);//加锁
if (p_ret)
puts("加锁失败。");
printf("hello ");
sleep(1); /*模拟长时间操作共享资源,导致cpu易主,产生与时间有关的错误*/
printf("world\n");
p_ret = pthread_mutex_unlock(&mutex);//解锁
if (p_ret)
puts("解锁失败。");
sleep(1);
}
return NULL;
}
int main(void)
{
int p_ret;
pthread_t tid;
int i = 5;
pthread_create(&tid, NULL, tfn, NULL);
// pthread_mutex_init(&mutex,NULL);//初始化
while (i--)
{
p_ret = pthread_mutex_lock(&mutex);//加锁
if (p_ret)
puts("加锁失败。");
printf("HELLO ");
sleep(1);
printf("WORLD\n");
p_ret = pthread_mutex_unlock(&mutex);//解锁
if (p_ret)
puts("加锁失败。");
sleep(1);
}
pthread_cancel(tid);//杀死子线程,子线程自带取消点(dui'a'o'yo调用printf函数,printf函数会调用write等系统调用函数
pthread_join(tid, NULL);
p_ret = pthread_mutex_destroy(&mutex);//销毁锁
if (p_ret)
puts("销毁锁失败。");
return 0;
}
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?