JAVA Map 之元素定位,冲突碰撞

基本特性:

  • 维持健值对的集合接口,健不可以重复,每一个健只能映射到一个值。
  • Map替代了原来的虚拟类Directory。
  • Map提供了三种集合视角,keys(KeySet),values(Values),entries(key-value)(EntrySet),Map元素的顺序体现于遍历器返回的Map元素顺序。
  • 需要注意的是,不可以用可变的元素作Map的健,这会影响到equals对键值的操作,例如,不可以使用Map自身作为key,但是可以作为value。
  • 一些Map的实现对key-value有特殊的要求,如key不可以为null。

 

HashMap:
 
查找索引:
 
jdk1.7 数组散列结构:
 
/**
* Returns index for hash code h.
*/
static int indexFor(int h, int length) {
// assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
return h & (length-1);
}
 
length为2的n次方的情况下,length-1 则二进制末尾为1,“&” 操作计算结果末尾位置与h二进制末尾相同(否则,末尾为0,和任何数的 “&” 操作,末尾都为0,散列性降低,易发生碰撞),定位索引的位置优劣取决于哈希函数生成哈希值的散列均匀程度。
 
h & (length -1) 相当于 h % length 但前者性能优于后者
 
 
jdk1.8
 
final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
...
 
索引策略同1.7
 
 
map 容量: 2的n次方
 
jdk1.7:指定 initialCapacity 则为 initialCapacity,不指定则为 DEFAULT_INITIAL_CAPACITY 16
 
涉及需要扩展容量时:
/**
* Inflates the table.
*/
private void inflateTable(int toSize) {
    // Find a power of 2 >= toSize 找到一个大于等于toSize的2的n次方数
    int capacity = roundUpToPowerOf2(toSize);
 
    threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);
    table = new Entry[capacity];
    initHashSeedAsNeeded(capacity);
}
 
private static int roundUpToPowerOf2(int number) {
    // assert number >= 0 : "number must be non-negative";
    int rounded = number >= MAXIMUM_CAPACITY
            ? MAXIMUM_CAPACITY
            : (rounded = Integer.highestOneBit(number)) != 0
                ? (Integer.bitCount(number) > 1) ? rounded << 1 : rounded
                : 1;
 
    return rounded;
}
 
 
jdk1.8: 如果指定初始容量 initialCapacity 则通过tableSizeFor 优化容量,如果不指定,则默认为 DEFAULT_INITIAL_CAPACITY 16;
 
构造函数:
 
public HashMap(int initialCapacity, float loadFactor) {
    if (initialCapacity < 0)
        throw new IllegalArgumentException("Illegal initial capacity: " +
                                           initialCapacity);
    if (initialCapacity > MAXIMUM_CAPACITY)
        initialCapacity = MAXIMUM_CAPACITY;
    if (loadFactor <= 0 || Float.isNaN(loadFactor))
        throw new IllegalArgumentException("Illegal load factor: " +
                                           loadFactor);
    this.loadFactor = loadFactor;
    this.threshold = tableSizeFor(initialCapacity);
}
...
/**
* 生成一个2的n次方数最为目标容量
* Returns a power of two size for the given target capacity.
* Hackers Delight, sec 3.2  章节3.2介绍的上舍入算法
*/
static final int tableSizeFor(int cap) {
    int n = cap - 1;
    n |= n >>> 1;
    n |= n >>> 2;
    n |= n >>> 4;
    n |= n >>> 8;
    n |= n >>> 16;
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
 
容量调整时,需要调用 tableSizeFor。
 
碰撞:
 
jdk1.7:使用数组散列,索引到同一位置的不同元素,使用链表存储,碰撞元素插入链表头部。
 
jdk1.8: TREEIFY_THRESHOLD 变量控制使用链表还是树,当链表节点数达到 TREEIFY_THRESHOLD(默认8),改为使用红黑树存储碰撞元素。
 
ConcurrentHashMap:
 
jdk1.7 segment 分段加锁
 
jdk1.8 synchronized(synchronized (f) ); cas(casTabAt)
 
TreeMap:
 
红黑树:
 
满足特定红黑性质的二叉搜索树,区别于平衡二叉树(AVL:左右子树高度差不能超过1),近似平衡(任何路径不能长于最小路径的2倍),节点增加color数据位(其它为k、left、right)。
 
节点标为红色,黑色
 
根节点时黑色的
 
每个叶节点(NIL)为黑色
 
如果一个节点为红色,则它的两个子节点为黑色
 
对于每个节点,从该节点到其所有后代叶节点的简单路径上,均包含相同数目的黑色节点,黑节点个数成为黑高。
 
 
posted @ 2016-10-23 14:31  WindWant  阅读(468)  评论(0编辑  收藏  举报
文章精选列表