同步与互斥的失败例子-02

一句话理解同步与互斥:我等你用完厕所,我再用厕所。

什么叫同步?就是条件不允许,我要等等。

什么是互斥?你我早起都要用厕所,谁先抢到谁先用,中途不被打扰。

同步与互斥经常放在一起讲,是因为它们之的关系很大,“互斥”操作可以使用“同步”来实现。我“等”你用完厕所,我再用厕所。这不就是用“同步”来实现“互斥”吗?

有时候看代码更容易理解,伪代码如下:

假设有A、B两人早起抢厕所,A先行一步占用了;B慢了一步,于是就眯一会;当A用完后叫醒B,B也就愉快地上厕所了。

在这个过程中,A、B是互斥地访问“厕所”,“厕所”被称之为临界资源。我们使用了“休眠-唤醒”的同步机制实现了“临界资源”的“互斥访问”。

 

 

上面是一个有“味道”的例子,回到程序员的世界,一个驱动程序同时只能有一个APP使用,怎么实现?

 

看第5行,我们使用一个全局变量valid来实现互斥访问。这有问题吗?很大概率没问题,但是并非万无一失。

注意:编写驱动程序时,要有系统的概念,程序A调用驱动程序时,它可能被程序B打断,程序B也去调用这个驱动程序。

下图是一个例子,程序A在调用驱动程序的中途被程序B抢占了CPU资源:

程序A执行到第11行之前,被程序B抢占了,这时valid尚未被改成0;

程序B调用gpio_key_drv_open时,发现valid等于1,所以成功返回0;

当程序A继续从第11行执行时,它最终也成功返回0;

这样程序A、B都成功打开了驱动程序。

注意:在内核态,程序A不是主动去休眠、主动放弃CPU资源;而是被优先级更高的程序B抢占了,这种行为被称为“preempt”(抢占)。

 

上面的例子是不是第5行到第11行的时间跨度大长了?再优化一下程序行不行?代码如下:

 

5行先减1再判断,这样可以更大概率地避免问题,但是还是不能确保万无一失。对数据的修改分为3步:读出来、修改、写进去。请看下图:

 

进程A在读出valid时发现它是1,减1后为0,这时if不成立;但是修改后的值尚未写回内存;

假设这时被程序B抢占,程序B读出valid仍为1,减1后为0,这时if不成立,最后成功返回;

轮到A继续执行,它把0值写到valid变量,最后也成功返回。

这样程序A、B都成功打开了驱动程序。

 

 

前面2个例子,都是在修改valid的过程中被别的进程抢占了,那么在修改valid的时候直接关中断不就可以了吗?

 

 

06行直接关中断,这样别的线程、中断都不能来打扰本线程了,在它读取、修改valid变量的过程中无人打扰。

没有问题了?

 

 

 

对于单CPU核的系统上述代码是没问题的;但是对于SMP系统,你只能关闭当前CPU核的中断,别的CPU核还可以运行程序,它们也可以来执行这个函数,同样导致问题,如下图:

 

假设CPU0上进程A、CPU1上进程B同时运行到上图中读出valid的地方,它们同时发现valid都是1,减减后都等于0,在第07行判断条件都不成立,所以在第14行都可以返回0,都可以成功打开驱动。

 

posted on 2024-05-03 14:22  拉风摊主  阅读(19)  评论(0编辑  收藏  举报

导航