面试时,面试官经常会通过volatile关键字来考核候选人在多线程方面的能力,一旦被问题此类问题,大家可以通过如下的步骤全面这方面的能力。
1 首先通过内存模型说明volatile关键字的作用
先说明,用volatile修饰的变量,能直接修改内存内容,修改后的变量对其他线程是可见的。然后展开说明如下的内容。
多线程并发操作同一资源时,可能会出现最终结果和预期不同的情况,刚才我们也已经通过线程安全和不安全相关的案例,直观地看到了这一情况,这里我们将通过线程的内存结构来详细分析下造成“最终结果不一致”的原因。
如果某个线程要操作data变量,该线程会先把data变量装载到线程内部的内存中做个副本,之后线程就不再和在主内存中的data变量有任何关系,而是会操作副本变量的值,操作完成后,再把这个副本回写到主内存(也就是堆内存)中,这个过程如下图所示。
假设data的初始值是0,有100个线程并发地对它进行加1操作,预期的运行结果是100。但在实际的操作过程中,假设A线程和B线程并发地data,其中A读到的值是0,B读到的是1。当B在它的线程内部内存中完成加1操作(data变成2),会把data回写到主内存里,这时主内存里的data也是2。
但之后,A线程也完成了加1操作(此时A内部线程中的data副本是1),在之后的回写过程中,会把主内存中的data变量从2设置成1,这样就造成数据不一致的问题了。
但是,如果data变量被volatile变量修饰,那么A线程修改好的data变量,无需等到“”回写“”阶段,能直接写回到主内存里,这就能导致该变量对其它线程“立即可见”。
2 同时说明,volatile不能解决数据不一致的问题
如果某个变量之前加了volatile,线程在每次使用该变量时,都会从主内存中读取该变量最新的值,而且,某线程一旦修改了该变量,这个修改会立即回写到主内存里。
既然是在操作前会从主内存中读取变量最新的值,而且每次修改后都会立即回写到主内存,这样的话是否能解决多线程中数据不一致的问题呢?通过下面的VolilateDemo.java代码,我们来看下这个问题的答案。
在main函数的第12行里,通过for循环启动1000个线程。从第13到16行里,我们通过了Runnable类定义了线程的动作,每个线程启动后,会调用第15行的add方法对用volatile修饰的cnt变量进行加1操作。
多次运行的结果可能不一样,但在大多数情况下,最终cnt的值会小于1000,也就是说,用volatile修饰的变量不能保证数据一致性,换句话说,volatile不能当锁来用,因为它不能保证主内存的变量在同一时间段里只被一个线程操作。
3 然后说下volatile的作用
那么volatile有什么用呢?被volatile修饰的变量每次在使用时,不是从各线程的内部内存中拿,而是从主内存中拿。这样就能避免“创建副本”到“把副本回写到主内存中”等的操作,从而能提升效率。
但请注意,如果我们在多线程环境下,针对某个变量有读和写的操作,那么别把它修饰成volatile,因为为了解决数据不一致的问题,我们会给该变量加锁,这样该变量在一个时间段里只会有一个线程进行操作,这样就无法发挥出volatile的优势了。
请记住这个结论,如果某个变量在多线程环境下只有读或者是只有写的操作,建议把它设置成volatile,这样能提升多线程并发时的效率。
4 如果可以,再扩展到ConcurrentHashMap的底层代码
说好上述内容以后,其实大家已经可以能充分展示内存方面的技能了,不过大家还可以多说一句:我还看过ConcurrentHashMap的底层源码,其中用到了volatile关键字。
ConcurrentHashMap是支持并发的HashMap,说白了就当多个线程同时读写ConcurrentHashMap对象时,不会有问题。
该对象存储键值对的Node对象定义如下,其中表示值的val变量被volatile修饰,也就是说,A线程对该ConcurrentHashMap的操作,能立即回写到主内存,所以其它线程也能立即可见,所以能支持并发。
当大家从volatile关键字引申到ConcurrentHashmap底层源码后,面试官就会认识你很资深。我记得当初,我去面试一家比较大的互联网公司,就这样说了一通,然后就直接通过这轮技术面试了(不过还有后继部门经理的技术面试)。
请大家关注我的公众号:一起进步,一起挣钱,在本公众号里,会有很多精彩的面试文章。