多线程下如何安全访问hashmap

image.png

1

线程同步指的是多线程的协同,定义多个线程如何访问特定资源,避免多线程并发访问导致数据不一致的问题。ArrayList、LinkkedList、HashMap是最常用的数据结构,但是他们是线程不安全的,在多线程场景下,如果不做控制,可能会到导致线程安全问题。

解决ArrayList、LinkedList线程安全方法

1、继承Arraylist,然后重写或按需求编写自己的方法,这些方法要写成synchronized,在这些synchronized的方法中调用ArrayList的方法。

2、使用Collections.synchronizedList();使用方法如下:

假如你创建的代码如下:List> data=new ArrayList>();

那么为了解决这个线程安全问题你可以这么使用Collections.synchronizedList(),如:

List> data=Collections.synchronizedList(new ArrayList>());
其他的都没变,使用的方法也几乎与ArrayList一样,大家可以参考下api文档;

额外说下 ArrayList与LinkedList;这两个都是接口List下的一个实现,用法都一样,但用的场所的有点不同,ArrayList适合于进行大量的随机访问的情况下使用,LinkedList适合在表中进行插入、删除时使用,二者都是非线程安全,解决方法同上(为了避免线程安全,以上采取的方法,特别是第二种,其实是非常损耗性能的)。

2

解决HashMap线程安全方法
1、继承HashMap,重写或者按要求编写自己的方法,这些方法要写成synchronized,在这些synchronized的方法中调用HashMap的方法
2、使用Collections.synchronizedMap()
3、使用ConcurrentHashMap替代,并不推荐新代码使用Hashtable,HashTable继承于Dictionary,任意时间只有一个线程能写Hashtable,并发性能不如ConcurrentHashMap,因为ConcurrentHashMap引入了分段锁。不需要线程安全的场景使用HashMap,需要线程安全的场合使用ConcurrentHashMap替换。

HashMap 是非线程安全的。在多线程条件下,容易导致死循环,具体表现为CPU使用率100%。因此多线程环境下保证 HashMap 的线程安全性,主要有如下几种方法:

  1. 使用 java.util.Hashtable 类,此类是线程安全的。

  2. 使用 java.util.concurrent.ConcurrentHashMap,此类是线程安全的。

  3. 使用 java.util.Collections.synchronizedMap() 方法包装 HashMap object,得到线程安全的Map,并在此Map上进行操作。

  4. 自己在程序的关键代码段加锁,保证多线程安全(不推荐)

3

接下来分析上面列举的几种方法实现并发安全的 HashMap 的原理:

(一)java.util.Hashtable类:

查看该类的源码

public synchronized V get(Object key) {  
    …… //具体的实现省略,请参考 jdk实现  
}  

public synchronized V put(K key, V value) {  
    …… //具体的实现省略,请参考 jdk实现  
}  

public synchronized V remove(Object key) {  
    …… //具体的实现省略,请参考 jdk实现  
}  

 上面是 Hashtable 类提供的几个主要方法,包括 get(),put(),remove() 等。注意到**每个方法本身都是 synchronized 的,不会出现两个线程同时对数据进行操作的情况,因此保证了线程安全性,但是也大大的降低了执行效率**。因此是不推荐的。

(二)使用 java.util.concurrent.ConcurrentHashMap 类:

该类是 HashMap 的线程安全版,与 Hashtable 相比, ConcurrentHashMap 不仅保证了访问的线程安全性,而且在效率上有较大的提高。

ConcurrentHashMap的数据结构如下:

image

可以看出,相对 HashMap 和 Hashtable, ConcurrentHashMap 增加了Segment 层,每个Segment 原理上等同于一个 Hashtable, ConcurrentHashMap 等同于一个 Segment 的数组。下面是 ConcurrentHashMap 的 put 和 get 方法:

final Segment<K,V> segmentFor(int hash) {  
    return segments[(hash >>> segmentShift) & segmentMask];  
}  

public V put(K key, V value) {  
    if (value == null)  
        throw new NullPointerException();  
    int hash = hash(key.hashCode());  
    return segmentFor(hash).put(key, hash, value, false);  
}  

public V get(Object key) {  
    int hash = hash(key.hashCode());  
    return segmentFor(hash).get(key, hash);  
}  

向 ConcurrentHashMap 中插入数据(put) 或者 读取数据(get),首先都要将相应的 Key 映射到对应的 Segment,因此不用锁定整个类, 只要对单个的 Segment 操作进行上锁操作就可以了。理论上如果有 n 个 Segment,那么最多可以同时支持 n 个线程的并发访问,从而大大提高了并发访问的效率。

posted @ 2020-09-11 12:13  姚狗蛋  阅读(220)  评论(0编辑  收藏  举报