ThreadLocal 详解
1.ThreadLocal是什么? / 为什么要使用ThreadLocal?
ThreadLocal是什么?
ThreadLocal就是一个java类,这个类的作用和线程局部变量有关。线程局部变量作用域是当前单个线程,在线程开始时分配,线程结束时回收。
ThreadLocal类位于java.lang包下,由JDK包提供。如果创建了一个ThreadLocal
变量,那么访问这个变量的每个线程都会有这个变量的本地副本,多个线程操作这个变量的时候,其实是在操作自己本地内存里的变量,他们可以使用 get()
和 set()
方法来获取默认值或将其值更改为当前线程所存的副本的值,从而避免了线程安全问题。
为什么要使用ThreadLocal?
并发场景下,会存在多个线程同时修改一个共享变量的场景,这就可能会出现线程安全问题。为了解决线程安全问题,可以用加锁的方式,比如synchronized或者lock,但是加锁可能会导致系统变慢
2.ThreadLocal的使用
public class UserContext { private static ThreadLocal threadLocal = new ThreadLocal(); public static User getUser() { return (User) threadLocal.get(); } public static void setUser(User user) { threadLocal.set(user); } public static void remove() { threadLocal.remove(); } }
首先ThreadLocal 是一个Java类,和线程局部变量有关,使用该类可以保证每个线程操作的都是本地内存中的变量副本,避免了线程安全问题。
在 Thread 类的源码中,定义了两个 ThreadLocal.ThreadLocalMap 类型的成员变量,分别为 threadLocals 和 inheritableThreadLocals,二者的初始值都为 null,只有当线程第一次调用 set()方法或者 get()方法时才会实例化变量。
这也说明了,通过 ThreadLocal 为每个线程保存的本地变量不是存储在 ThreadLocal 实例中的,而是存储在调用线程的 threadLocals 变量中的, ThreadLocal 类只是提供了 set()和 get()方法来存储和读取本地变量的值,当调用 ThreadLocal 类的 set()方法时,把要存储的值存储在调用线程的 threadLocals 变量中,当调用 ThreadLocal 类的 get()方法时,从当前线程的 threadLocals 变量中获取保存的值。
然后再说一下set、get、remove方法的具体步骤:
set方法首先会获取当前线程,然后以当前线程为key通过getMap方法,获取ThreadLocalMap对象,如果map不为空就设置value的值,如果为空,要先调用 createMap方法来实例化当前线程的threadLocals成员变量,并保存value值。
get()方法会通过调用 getMap(Thread t)方法并传入当前线程来获取 threadLocals 成员变量,随后判断当前线程的 threadLocals 成员变量是否为空。如果 threadLocals 成员变量不为空,则直接返回当前线程 threadLocals 成员变量中存储的本地变量的值。如果 threadLocals 成员变量为空,则调用 setInitialvalue()方法来初始化 threadLocals 成员变量的值。
remove()方法的实现比较简单,根据调用的 getMap()方法获取当前线程的 threadLocals 成员变量,如果当前线程的 threadLocals 成员变量不为空,则直接从当前线程的 threadLocals 成员变量中移除当前 ThreadLocal 对象对应的 value 值。
//ThreadLocal.set方法 public void set(T value) { //获取当前线程 Thread t = Thread.currentThread(); //以当前线程为 key,获取 ThreadLocalMap 对象 ThreadLocalMap map = getMap(t); //获取的ThreadLocalMap 对象不为空 if (map != null) //设置 value 的值 map.set(this, value); else //获取的 ThreadLocalMap 对象为空,实例化 Thread 类中的 threadLocals 变量 createMap(t, value); } ThreadLocalMap getMap(Thread t) { return t.threadLocals; } void createMap(Thread t, T firstvalue) { t.threadLocals = new ThreadLocalMap(this, firstvalue); }
//ThreadLocal.get方法 public T get() { //获取当前线程 Thread t = Thread.currentThread(); //获取当前线程的 threadLocals 成员变量 ThreadLocalMap map = getMap(t); //获取的threadLocals 成员变量不为空 if (map != null) { //返回本地变量对应的值 ThreadLocalMap.Entry e = map.getEntry(this); if (e != null) { @SuppressWarnings("unchecked") T result = (T)e.value; return result; } } //初始化threadLocals 成员变量的值 return setInitialvalue(); } private T setInitialvalue() { //调用初始化 value 的方法 T value = initialvalue(); Thread t = Thread.currentThread(); //以当前线程为 key 获取 threadLocals 成员变量 ThreadLocalMap map = getMap(t);
if (map != null) //threadLocals 不为空,则设置value 值 map.set(this, value);
else //threadLocals 为空,则实例化 threadLocals 成员变量 createMap(t, value);
return value; } protected T initialvalue() { return null; }
public static <S> ThreadLocal<S> withInitial(Supplier<? extends S> supplier) {} //withInitial():用于创立一个线程局部变量,变量的初始化值通过调用Supplier的get办法来确定
4.ThreadLocal内存泄露问题:
ThreadLocalMap
中使用的 key 为 ThreadLocal
的弱引用,而 value 是强引用。所以,如果 ThreadLocal
没有被外部强引用的情况下,在垃圾回收的时候,key 会被清理掉,而 value 不会被清理掉。
这样一来,ThreadLocalMap
中就会出现 key 为 null 的 Entry。ThreadLocalMap 的生命周期跟 Thread 一样长,假如我们不做任何措施的话,value 永远无法被 GC 回收,这个时候就可能会产生内存泄露。ThreadLocalMap
实现中已经考虑了这种情况,在调用 set()
、get()
、remove()
方法的时候,会清理掉 key 为 null 的记录。使用完 ThreadLocal
方法后,最好手动调用remove()
方法。
static class Entry extends WeakReference<ThreadLocal<?>> { /** The value associated with this ThreadLocal. */ Object value; Entry(ThreadLocal<?> k, Object v) { super(k); value = v; } }
5.ThreadLocal
的数据结构:
Thread
类有一个类型为ThreadLocal.ThreadLocalMap
的实例变量threadLocals
,也就是说每个线程有一个自己的ThreadLocalMap
。
ThreadLocalMap
有自己的独立实现,它的key
是ThreadLocal的一个弱引用
,value
为代码中放入的值。
每个线程在往ThreadLocal
里放值的时候,都会往自己的ThreadLocalMap
里存,读也是以ThreadLocal
作为引用,在自己的map
里找对应的key
,从而实现了线程隔离。
6.GC 之后 key 是否为 null?
ThreadLocal
的key
是弱引用,那么在ThreadLocal.get()
的时候,发生GC
之后,key
是否是null
?
ThreadLocalMap 的 set 方法,通过调用 replaceStaleEntry 方法回收键为 null 的 Entry 对象的值(即为具体实例)以及 Entry 对象本身从而防止内存泄漏。
你把key这个引用赋值为null, 并不意味着Hashmap
里的key也是null.
7.ThreadLocalMap的Hash算法
最关键的就是threadLocalHashCode
值的计算,ThreadLocal
中有一个属性为HASH_INCREMENT = 0x61c88647。
每创建一个ThreadLocal
对象,这个ThreadLocal.nextHashCode
这个值就会增长 0x61c88647
。这个值很特殊,它是斐波那契数 也叫 黄金分割数。hash
增量为 这个数字,带来的好处就是 hash
分布非常均匀。
int i = key.threadLocalHashCode & (len-1); public class ThreadLocal<T> { private final int threadLocalHashCode = nextHashCode(); private static AtomicInteger nextHashCode = new AtomicInteger(); private static final int HASH_INCREMENT = 0x61c88647; private static int nextHashCode() { return nextHashCode.getAndAdd(HASH_INCREMENT); } static class ThreadLocalMap { ThreadLocalMap(ThreadLocal<?> firstKey, Object firstValue) { table = new Entry[INITIAL_CAPACITY]; int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1); table[i] = new Entry(firstKey, firstValue); size = 1; setThreshold(INITIAL_CAPACITY); } } }
8.ThreadLocalMap的Hash冲突
如果我们插入一个value=27
的数据,通过 hash
计算后应该落入槽位 4 中,而槽位 4 已经有了 Entry
数据。此时就会线性向后查找,一直找到 Entry
为 null
的槽位才会停止查找,将当前元素放入此槽位中。当然迭代过程中还有其他的情况,比如遇到了 Entry
不为 null
且 key
值相等的情况,还有 Entry
中的 key
值为 null
的情况等等都会有不同的处理。在set
过程中,如果遇到了key
过期的Entry
数据,实际上是会进行一轮探测式清理操作的。
ThreadLocalMap.set()详解:
第一种情况: 通过hash
计算后的槽位对应的Entry
数据为空:直接将数据放到该槽位即可。
第二种情况: 槽位数据不为空,key
值与当前ThreadLocal
通过hash
计算获取的key
值一致:直接更新该槽位的数据。
第三种情况: 槽位数据不为空,往后遍历过程中,在找到Entry
为null
的槽位之前,没有遇到key
过期的Entry
:遍历散列数组,线性往后查找,如果找到Entry
为null
的槽位,则将数据放入该槽位中,或者往后遍历过程中,遇到了key 值相等的数据,直接更新即可。
第四种情况: 槽位数据不为空,往后遍历过程中,在找到Entry
为null
的槽位之前,遇到key
过期的Entry
,如下图,往后遍历过程中,遇到了index=7
的槽位数据Entry
的key=null
:表明此数据key
值已经被垃圾回收掉了,此时就会执行replaceStaleEntry()
方法,该方法含义是替换过期数据的逻辑,以index=7位起点开始遍历,进行探测式数据清理工作。
replaceStaleEntry
():
(1)初始化探测式清理过期数据扫描的开始位置:slotToExpunge=staleSlot(过期桶位置)=7
(2)以当前节点向前迭代,检测是否有过期的entry,如果有则更新slotToExpunge值,继续向前迭代,碰到null则结束探测。
(3)从当前staleSlot向后迭代
查找到key值相等的Entry元素:找到后更新Entry的值并交换staleSlot元素的位置,更新数据。(4)开始清理工作,从slotToExpunge开始向后检查过期数据,并清理。
未查找到key值相等的Entry元素:直到Entry为null则停止查找。(4)创建新的Entry,替换table[staleSlot]位置,进行过期元素清理工作。
清理工作的两个方法:
探测式清理:expungeStaleEntry()
以当前Entry
往后清理,遇到值为null
则结束清理,属于线性探测清理。
遍历散列数组,从开始位置向后探测清理过期数据,将过期数据的Entry
设置为null
,沿途中碰到未过期的数据则将此数据rehash
后重新在table
数组中定位,如果定位的位置已经有了数据,则会将未过期的数据放到最靠近此位置的Entry=null
的桶中,使rehash
后的Entry
数据距离正确的桶的位置更近一些。
执行expungeStaleEntry(3):
(1)清空entry[3]对应的slot数据,然后继续向后探测
(2)碰到正常数据,计算该数据位置是否偏移,如果被偏移,则重新计算slot位置,目的是让正常数据尽可能存放在正确位置或离正确位置更近的位置。
(3)依次往后检查,直到碰到空的slot,终止探测
启发式清理:cleanSomeSlots()
试探性地扫描一些单元格以查找过时的条目。
在cleanSomeSlots内部会选择不同的位置为起点,轮询调用expungeStaleEntry()进行向后探测清理。
private boolean cleanSomeSlots(int i, int n) { boolean removed = false; Entry[] tab = table; int len = tab.length; do { i = nextIndex(i, len); Entry e = tab[i]; if (e != null && e.get() == null) { n = len; removed = true; i = expungeStaleEntry(i); } } while ( (n >>>= 1) != 0); return removed; } //在新增或删除脏元素的时候,通过对数方式扫描一些脏的Entry,作为不扫描和与节点数量成比例的扫描之间的平衡。 不扫描:快速但是保留垃圾 节点数量成比例扫描:需要花费O(n)时间,清空所有垃圾数据
9.ThreadLocalMap扩容机制:
在ThreadLocalMap.set()
方法的最后,如果执行完启发式清理工作后,未清理到任何数据,且当前散列数组中Entry
的数量已经达到了列表的扩容阈值(len*2/3)
,就开始执行rehash()
逻辑:
private void rehash() { //进行探测式清理工作 expungeStaleEntries(); //根据size >= threshold * 3/4来决定是否扩容 if (size >= threshold - threshold / 4) resize(); } private void expungeStaleEntries() { Entry[] tab = table; int len = tab.length; for (int j = 0; j < len; j++) {//从table的起始位置往后进行探测式清理 Entry e = tab[j]; //如果是过期entry if (e != null && e.get() == null)//e.get()为key expungeStaleEntry(j); } }
!!!注意:entry.size达到threshold=len*2/3 ---> rehash()
entry.size达到threshold*3/4 ---> resize()
resize():
扩容后的tab
的大小为oldLen * 2
,然后遍历老的散列表,重新计算hash
位置,然后放到新的tab
数组中,如果出现hash
冲突则往后寻找最近的entry
为null
的槽位,遍历完成之后,oldTab
中所有的entry
数据都已经放入到新的tab
中了。重新计算tab
下次扩容的阈值。
ThreadLocalMap.get():
java.lang.ThreadLocal.ThreadLocalMap.getEntry()
第一种情况: 通过查找key
值计算出散列表中slot
位置,然后该slot
位置中的Entry.key
和查找的key
一致,则直接返回。
第二种情况: 通过查找key
值计算出散列表中slot
位置,该slot
位置中的Entry.key
和要查找的key
不一致,需要继续往后迭代,迭代到过期entry时会触发一次探测式数据回收,执行expungeStaleEntry()方法,执行之后过期entry被回收,正常数据会尽可能存放在离正确位置更近的位置。此时从该位置继续往后迭代,就可能会找到key值相等entry了。
以get(ThreadLocal1)
为例,通过hash
计算后,正确的slot
位置应该是 4,而index=4
的槽位已经有了数据,且key
值不等于ThreadLocal1
,所以需要继续往后迭代查找。
迭代到index=5
的数据时,此时Entry.key=null
,触发一次探测式数据回收操作,执行expungeStaleEntry()
方法,执行完后,index 5,8
的数据都会被回收,而index 6,7
的数据都会前移。index 6,7
前移之后,继续从 index=5
往后迭代,于是就在 index=5
找到了key
值相等的Entry
数据。
ThreadLocal
使用场景
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY