并发编程(四):ThreadLocal从源码分析总结到内存泄漏

一、目录

     1、ThreadLocal是什么?有什么用?
     2、ThreadLocal源码简要总结?
     3、ThreadLocal为什么会导致内存泄漏?

二、ThreadLocal是什么?有什么用?

引入话题:在并发条件下,如何正确获得共享数据?举例:假设有多个用户需要获取用户信息,一个线程对应一个用户。在mybatis中,session用于操作数据库,那么设置、获取操作分别是session.set()、session.get(),如何保证每个线程都能正确操作达到想要的结果?
/**
 * 回顾synchronized在多线程共享线程的问题
 * @author qiuyongAaron
 */
public class ThreadLocalOne {
     volatile Person person=new Person();
 </span><span style="color: #0000ff;">public</span>  <span style="color: #0000ff;">synchronized</span><span style="color: #000000;"> String setAndGet(String name){
      </span><span style="color: #008000;">//</span><span style="color: #008000;">System.out.print(Thread.currentThread().getName()+":");</span>
       person.name=<span style="color: #000000;">name;
       </span><span style="color: #008000;">//</span><span style="color: #008000;">模拟网络延迟</span>
       <span style="color: #0000ff;">try</span><span style="color: #000000;"> {
            TimeUnit.SECONDS.sleep(</span>2<span style="color: #000000;">);
       } </span><span style="color: #0000ff;">catch</span><span style="color: #000000;"> (InterruptedException e) {
            e.printStackTrace();
       }
       </span><span style="color: #0000ff;">return</span><span style="color: #000000;"> person.name;
 }

 </span><span style="color: #0000ff;">public</span> <span style="color: #0000ff;">static</span> <span style="color: #0000ff;">void</span><span style="color: #000000;"> main(String[] args) {
       ThreadLocalOne  threadLocal</span>=<span style="color: #0000ff;">new</span><span style="color: #000000;"> ThreadLocalOne();
       </span><span style="color: #0000ff;">new</span> Thread(()-&gt;System.out.println(threadLocal.setAndGet("arron")),"t1"<span style="color: #000000;">).start();
       </span><span style="color: #0000ff;">new</span> Thread(()-&gt;System.out.println(threadLocal.setAndGet("tony")),"t2"<span style="color: #000000;">).start();
 }

}

class Person{
String name
="tom";
public Person(String name) {
this.name=name;
}

 </span><span style="color: #0000ff;">public</span><span style="color: #000000;"> Person(){}

}

运行结果:
无synchronized:
t1:tony
t2:tony

有synchronized:
t1:arron
t2:tony

步骤分析:
  1. 无synchronized的时候,因为非原子操作,显然不是预想结果,可参考我关于synchronized的讨论。
  2. 现在,我们的需求是:每个线程独立的设置获取person信息,不被线程打扰。
  3. 因为,person是共享数据,用同步互斥锁synchronized,当一个线程访问共享数据的时候,其他线程堵塞,不再多余赘述。
 
通过举例问题,可能大家又会很疑惑?
mybatis、hibernate是如何实现的呢?
synchronized不会很消耗资源,当成千上万个操作的时候,承受并发不说,数据返回延迟如何确保用户体验?
 
ThreadLocal是什么?有什么用?
/**
 * 谈谈ThreadLocal的作用
 * @author qiuyongAaron
 */
public class ThreadLocalThree {
     ThreadLocal<Person> threadLocal=new ThreadLocal<Person>();
     public String setAndGet(String name){
           threadLocal.set(new Person(name));
           try {
                TimeUnit.SECONDS.sleep(2);
           } catch (InterruptedException e) {
                e.printStackTrace();
           }
           return threadLocal.get().name;
     }
 </span><span style="color: #0000ff;">public</span> <span style="color: #0000ff;">static</span> <span style="color: #0000ff;">void</span><span style="color: #000000;"> main(String[] args) {
       ThreadLocalThree  threadLocal</span>=<span style="color: #0000ff;">new</span><span style="color: #000000;"> ThreadLocalThree();
       </span><span style="color: #0000ff;">new</span> Thread(()-&gt;System.out.println("t1:"+threadLocal.setAndGet("arron")),"t1"<span style="color: #000000;">).start();
       </span><span style="color: #0000ff;">new</span> Thread(()-&gt;System.out.println("t2:"+threadLocal.setAndGet("tony")),"t2"<span style="color: #000000;">).start();
 }

}
运行结果:
t1:arron
t2:tony

 
分析:
1、根据预期结果,那ThreadLocal到底是什么?
回顾Java内存模型:
  
      在虚拟机中,堆内存用于存储共享数据(实例对象),堆内存也就是这里说的主内存。
     每个线程将会在堆内存中开辟一块空间叫做线程的工作内存,附带一块缓存区用于存储共享数据副本。那么,共享数据在堆内存当中,线程通信就是通过主内存为中介,线程在本地内存读并且操作完共享变量操作完毕以后,把值写入主内存。
  1. ThreadLocal被称为线程局部变量,说白了,他就是线程工作内存的一小块内存,用于存储数据。
  2. 那么,ThreadLocal.set()、ThreadLocal.get()方法,就相当于把数据存储于线程本地,取也是在本地内存读取。就不会像synchronized需要频繁的修改主内存的数据,再把数据复制到工作内存,也大大提高访问效率。
 
2、ThreadLocal到底有什么用?
  1. 回到最开始的举例,也就等价于mabatis、hibernate为什么要使用threadlocal来存储session?
  2. 作用一:因为线程间的数据交互是通过工作内存与主存的频繁读写完成通信,然而存储于线程本地内存,提高访问效率,避免线程阻塞造成cpu吞吐率下降。
  3. 作用二:在多线程中,每一个线程都需要维护session,轻易完成对线程独享资源的操作。
 
总结:
     Threadlocal是什么?在堆内存中,每个线程对应一块工作内存,threadlocal就是工作内存的一小块内存。
     Threadlocal有什么用?threadlocal用于存取线程独享数据,提高访问效率。

三、ThreadLocal源码简要总结?

那有同学可能还是有点云里雾里,感觉还是没有吃透?那线程内部如何去保证线程独享数据呢?
 
在这里,我只做简要总结,若有兴趣,可参考文章尾部的文章链接。重点看get、set方法。
 public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
 }
分析:
  1. 一个线程对应一个ThreadLocalMap ,可以存储多个ThreadLocal对象。
  2. ThreadLocal对象作为key、独享数据作为value。
  3. ThreadLocalMap可参考HashMap,在ThreadMap里面存在Entry数组也就是一个Entry一个键值对。
 
public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }
分析:
  1. 一个线程对应一个ThreadLocalMap,get()就是当前线程获取自己的ThreadLocalMap。
  2. 线程根据使用那一小块的threadlocal,根据ThreadLocal对象作为key,去获取存储于ThreadLocalMap中的值。
 
总结:
     回顾一下,我们在单线程中如何使用HashMap的?hashMap根据数组+链表来实现HashMap,一个key对应一个value。那么,我们抽象一下,Threadlocal也相当于在多线程中的一种HashMap用法,相当于对ThradLocal的操作也就如单线程操作一样。
     总之,ThreadLocal就是堆内存的一块小内存,它用ThreadLocalMap维护ThreadLocal对象作为key,独享数据作为value的东西。
 

四、ThreadLocal为什么会导致内存泄漏?

synchronized是用时间换空间、ThreadLocal是用空间换时间,为什么这么说?
因为synchronized操作数据,只需要在主存存一个变量即可,就阻塞等共享变量,而ThreadLocal是每个线程都创建一块小的堆工作内存。显然,印证了上面的说法。
 
一个线程对应一块工作内存,线程可以存储多个ThreadLocal。那么假设,开启1万个线程,每个线程创建1万个ThreadLocal,也就是每个线程维护1万个ThreadLocal小内存空间,而且当线程执行结束以后,假设这些ThreadLocal里的Entry还不会被回收,那么将很容易导致堆内存溢出。
 
怎么办?难道JVM就没有提供什么解决方案吗?
ThreadLocal当然有想到,所以他们把ThreadLocal里的Entry设置为弱引用,当垃圾回收的时候,回收ThreadLocal。
什么是弱引用?
  1. Key使用强引用:也就是上述说的情况,引用的ThreadLocal的对象被回收了,ThreadLocal的引用ThreadLocalMap的Key为强引用并没有被回收,如果不手动回收的话,ThreadLocal将不会回收那么将导致内存泄漏。
  2. Key使用弱引用:引用的ThreadLocal的对象被回收了,ThreadLocal的引用ThreadLocalMap的Key为弱引用,如果内存回收,那么将ThreadLocalMap的Key将会被回收,ThreadLocal也将被回收。value在ThreadLocalMap调用get、set、remove的时候就会被清除。
  3. 比较两种情况,我们可以发现:由于ThreadLocalMap的生命周期跟Thread一样长,如果都没有手动删除对应key,都会导致内存泄漏,但是使用弱引用可以多一层保障:弱引用ThreadLocal不会内存泄漏,对应的value在下一次ThreadLocalMap调用set,get,remove的时候会被清除
 
那按你这么说,既然JVM有保障了,还有什么内存泄漏可言?
ThreadLocalMap使用ThreadLocal对象作为弱引用,当垃圾回收的时候,ThreadLocalMap中Key将会被回收,也就是将Key设置为null的Entry。如果线程迟迟无法结束,也就是ThreadLocal对象将一直不会回收,回顾到上面存在很多线程+TheradLocal,那么也将导致内存泄漏。
 
其实,在ThreadLocal中,当调用remove、get、set方法的时候,会清除为null的弱引用,也就是回收ThreadLocal。
总结:
  1. JVM利用设置ThreadLocalMap的Key为弱引用,来避免内存泄露。
  2. JVM利用调用remove、get、set方法的时候,回收弱引用。
  3. 当ThreadLocal存储很多Key为null的Entry的时候,而不再去调用remove、get、set方法,那么将导致内存泄漏。
  4. 当使用static ThreadLocal的时候,延长ThreadLocal的生命周期,那也可能导致内存泄漏。因为,static变量在类未加载的时候,它就已经加载,当线程结束的时候,static变量不一定会回收。那么,比起普通成员变量使用的时候才加载,static的生命周期加长将更容易导致内存泄漏危机。http://www.importnew.com/22039.html

 、版权声明

  作者:邱勇Aaron

  出处:http://www.cnblogs.com/qiuyong/

  您的支持是对博主深入思考总结的最大鼓励。

  本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,尊重作者的劳动成果。

  参考:马士兵并发编程、并发编程实践

     ThreadLocal源码分析:http://www.cnblogs.com/digdeep/p/4510875.html

     ThradLocal内存分析实例:http://blog.xiaohansong.com/2016/08/09/ThreadLocal-leak-analyze/
     ThreadLoal导致内存泄漏:http://www.importnew.com/22039.html
posted @ 2017-06-28 21:20  码农皮邱  阅读(6471)  评论(7编辑  收藏  举报