并发编程之五--ThreadLocal

一、ThreadLocal是什么

二、ThreadLocal的场景

三、ThreadLocal原理

四、ThreadLocal需要避开的坑

五、有什么方式能提高 ThreadLocal 的性能吗?

六、Thread同步机制的比较

 

一、ThreadLocal是什么

早在JDK 1.2的版本中就提供java.lang.ThreadLocal,ThreadLocal为解决多线程程序的并发问题提供了一种新的思路。使用这个工具类可以很简洁地编写出优美的多线程程序。

ThreadLocal很容易让人望文生义,想当然地认为是一个“本地线程”。其实,ThreadLocal并不是一个Thread,而是Thread的局部变量,也许把它命名为ThreadLocalVariable更容易让人理解一些。

当使用ThreadLocal维护变量时,ThreadLocal为每个使用该变量的线程提供独立的变量副本,所以每一个线程都可以独立地改变自己的副本,而不会影响其它线程所对应的副本。

从线程的角度看,目标变量就象是线程的本地变量,这也是类名中“Local”所要表达的意思。

线程局部变量并不是Java的新发明,很多语言(如IBM IBM XL FORTRAN)在语法层面就提供线程局部变量。在Java中没有提供在语言级支持,而是变相地通过ThreadLocal的类提供支持。

所以,在Java中编写线程局部变量的代码相对来说要笨拙一些,因此造成线程局部变量没有在Java开发者中得到很好的普及

ThreadLocal的接口方法

ThreadLocal类接口很简单,只有4个方法,我们先来了解一下:

void set(Object value)

设置当前线程的线程局部变量的值。

public Object get()

该方法返回当前线程所对应的线程局部变量。

public void remove()

将当前线程局部变量的值删除,目的是为了减少内存的占用,该方法是JDK 5.0新增的方法。需要指出的是,当线程结束后,对应该线程的局部变量将自动被垃圾回收,所以显式调用该方法清除线程的局部变量并不是必须的操作,但它可以加快内存回收的速度。

protected Object initialValue()

返回该线程局部变量的初始值,该方法是一个protected的方法,显然是为了让子类覆盖而设计的。这个方法是一个延迟调用方法,在线程第1次调用get()或set(Object)时才执行,并且仅执行1次。ThreadLocal中的缺省实现直接返回一个null。

值得一提的是,在JDK5.0中,ThreadLocal已经支持泛型,该类的类名已经变为ThreadLocal<T>。API方法也相应进行了调整,新版本的API方法分别是void set(T value)、T get()以及T initialValue()。

二、ThreadLocal的场景

场景一:ThreadLocal+MDC 实现链路日志增强

例如:在log日志中,打印国家码、会员信息等系统类或基本信息类的内容;
场景二:ThreadLocal 实现线程内的缓存,避免重复调用

例如:在组合查询时,按照逻辑步骤时,可能调用基础类接口多次,这时可以通过全局变量或线程变量作为缓存,减少接口调用次数提高性能。
场景三:ThreadLocal 实现数据库读写分离下强制读主库

例如:通过AbstractRoutingDataSource+threadLocal(调用方隐式传递进来)达到动态切换数据源的目的。
场景四:ThreadLocal 实现同一线程下多个类之间的数据传递

这里有个坑,见:《ThreadLocal的坑--ThreadLocal跨线程传递问题

 三、ThreadLocal原理

ThreadLocal 在使用的时候是单独创建对象的,更像一个全局的容器。但是大家有没有想过一个问题,就是为啥要设计 ThreadLocal 这个类,而不使用 HashMap 这样的容器类?

ThreadLocal 本质上是要解决线程之间数据的隔离,以达到互不影响的目的。如果我们用一个 Map 做数据存储,Key 为线程 ID, Value 为你要存储的内容,其实也是能达到隔离的效果。我们自己就可以提供一个简单的实现版本:

代码清单 1 SimpleThreadLocal

import java.util.Collections;
import java.util.HashMap;
import java.util.Map;

public class SimpleThreadLocal {
    private Map valueMap = Collections.synchronizedMap(new HashMap());

    public void set(Object newValue) {
        valueMap.put(Thread.currentThread(), newValue);// ①键为线程对象,值为本线程的变量副本
    }

    public Object get() {
        Thread currentThread = Thread.currentThread();
        Object o = valueMap.get(currentThread);// ②返回本线程对应的变量
        if (o == null && !valueMap.containsKey(currentThread)) {// ③如果在Map中不存在,放到Map中保存起来。
            o = initialValue();
            valueMap.put(currentThread, o);
        }
        return o;
    }

    public void remove() {
        valueMap.remove(Thread.currentThread());
    }

    public Object initialValue() {
        return null;
    }
}

虽然上面的这个ThreadLocal实现版本显得比较幼稚,但它和JDK所提供的ThreadLocal类在实现思路上是相近的。没错,效果是能达到,但是性能就不一定好了,涉及到多个线程进行数据操作。如果你不看 ThreadLocal 的源码,你肯定也会以为 ThreadLocal 就是这么实现的。

ThreadLocal 在设计这块很巧妙,会在 Thread 类中嵌入一个 ThreadLocalMap的内部类,ThreadLocalMap 就是一个容器,用于存储数据的,但它在 Thread 类中,也就说存储的就是这个 Thread 类专享的数据。

 

 

 

 参考《内部类的特点和使用场景

四、ThreadLocal需要避开的坑

1、避免跨线程异步传递

ThreadLocal的坑--ThreadLocal跨线程传递问题

2、使用时记得及时 remove, 防止内存泄露

深入ThreadLocal之三(ThreadLocal可能引起的内存泄露)

3、注释说明使用场景,方便后人

4、对性能有极致要求可以参考开源框架的做法,用一些优化后的类,比如 FastThreadLocal

五、有什么方式能提高 ThreadLocal 的性能吗?

性能提升主要表现在如下几点:

  • FastThreadLocal 操作数据的时候,会使用下标的方式在数组中进行查找来代替 ThreadLocal 通过哈希的方式进行查找。
  • FastThreadLocal 利用字节填充来解决伪共享问题。

其实除了 Netty 中对 ThreadLocal 进行了优化,自定义了 FastThreadLocal。在其他的框架中也有类似的优化,比如 Dubbo 中就 InternalThreadLocal,根据源码中的注释,也是参考了 FastThreadLocal 的设计,基本上差不多。

六、Thread同步机制的比较

ThreadLocal和线程同步机制相比有什么优势呢?ThreadLocal和线程同步机制都是为了解决多线程中相同变量的访问冲突问题。

在同步机制中,通过对象的锁机制保证同一时间只有一个线程访问变量。这时该变量是多个线程共享的,使用同步机制要求程序慎密地分析什么时候对变量进行读写,什么时候需要锁定某个对象,什么时候释放对象锁等繁杂的问题,程序设计和编写难度相对较大。而ThreadLocal则从另一个角度来解决多线程的并发访问。ThreadLocal会为每一个线程提供一个独立的变量副本,从而隔离了多个线程对数据的访问冲突。因为每一个线程都拥有自己的变量副本,从而也就没有必要对该变量进行同步了。ThreadLocal提供了线程安全的共享对象,在编写多线程代码时,可以把不安全的变量封装进ThreadLocal

由于ThreadLocal中可以持有任何类型的对象,低版本JDK所提供的get()返回的是Object对象,需要强制类型转换。但JDK 5.0通过泛型很好的解决了这个问题,在一定程度地简化ThreadLocal的使用,代码清单 9 2就使用了JDK 5.0新的ThreadLocal<T>版本。

概括起来说,对于多线程资源共享的问题,同步机制采用了“以时间换空间”的方式,而ThreadLocal采用了“以空间换时间”的方式。前者仅提供一份变量,让不同的线程排队访问,而后者为每一个线程都提供了一份变量,因此可以同时访问而互不影响。

Spring使用ThreadLocal解决线程安全问题

我们知道在一般情况下,只有无状态的Bean才可以在多线程环境下共享,在Spring中,绝大部分Bean都可以声明为singleton作用域。就是因为Spring对一些Bean(如RequestContextHolder、TransactionSynchronizationManager、LocaleContextHolder等)中非线程安全状态采用ThreadLocal进行处理,让它们也成为线程安全的状态,因为有状态的Bean就可以在多线程中共享了。

一般的Web应用划分为展现层、服务层和持久层三个层次,在不同的层中编写对应的逻辑,下层通过接口向上层开放功能调用。在一般情况下,从接收请求到返回响应所经过的所有程序调用都同属于一个线程,如图9‑2所示:

图 1同一线程贯通三层

这样你就可以根据需要,将一些非线程安全的变量以ThreadLocal存放,在同一次请求响应的调用线程中,所有关联的对象引用到的都是同一个变量。

下面的实例能够体现Spring对有状态Bean的改造思路:

代码清单3 TopicDao:非线程安全

import java.sql.Connection;
import java.sql.SQLException;
import java.sql.Statement;

public class TopicDao {
    private Connection conn;// ①一个非线程安全的变量

    public void addTopic() {
        try {
            Statement stat = conn.createStatement();// ②引用非线程安全变量
            //
        } catch (SQLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }
}

由于①处的conn是成员变量,因为addTopic()方法是非线程安全的,必须在使用时创建一个新TopicDao实例(非singleton)。下面使用ThreadLocal对conn这个非线程安全的“状态”进行改造:

代码清单4 TopicDao:线程安全

import java.sql.Connection;

public class ConnectionManager {

    public static Connection getConnection() {
        return null;
    }
}
import java.sql.Connection;
import java.sql.SQLException;
import java.sql.Statement;

public class TopicDao2 {
    // ①使用ThreadLocal保存Connection变量
    private static ThreadLocal<Connection> connThreadLocal = new ThreadLocal<Connection>();

    public static Connection getConnection() {
        // ②如果connThreadLocal没有本线程对应的Connection创建一个新的Connection,并将其保存到线程本地变量中。
        if (connThreadLocal.get() == null) {
            Connection conn = ConnectionManager.getConnection();
            connThreadLocal.set(conn);
            return conn;
        } else {
            return connThreadLocal.get();// ③直接返回线程本地变量
        }
    }

    public void addTopic() {

        try {
            // ④从ThreadLocal中获取线程对应的Connection
            Statement stat = getConnection().createStatement();
        } catch (SQLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}

不同的线程在使用TopicDao时,先判断connThreadLocal.get()是否是null,如果是null,则说明当前线程还没有对应的Connection对象,这时创建一个Connection对象并添加到本地线程变量中;如果不为null,则说明当前的线程已经拥有了Connection对象,直接使用就可以了。这样,就保证了不同的线程使用线程相关的Connection,而不会使用其它线程的Connection。因此,这个TopicDao就可以做到singleton共享了。

当然,这个例子本身很粗糙,将Connection的ThreadLocal直接放在DAO只能做到本DAO的多个方法共享Connection时不发生线程安全问题,但无法和其它DAO共用同一个Connection,要做到同一事务多DAO共享同一Connection,必须在一个共同的外部类使用ThreadLocal保存Connection。

小结

ThreadLocal是解决线程安全问题一个很好的思路,它通过为每个线程提供一个独立的变量副本解决了变量并发访问的冲突问题。在很多情况下,ThreadLocal比直接使用synchronized同步机制解决线程安全问题更简单,更方便,且结果程序拥有更高的并发性。

参考:

https://mp.weixin.qq.com/s/9gXSrw6llYy29OPH-rQuxQ

posted on 2015-12-29 14:47  duanxz  阅读(375)  评论(0编辑  收藏  举报