HashMap源码1

jdk1.8之前是数组+链表的形式，后面会介绍jdk1.8对hashMap的改动：数组+链表+红黑树

 transient是Java语言的关键字，用来表示一个域不是该对象串行化的一部分。
当一个对象被串行化的时候，transient型变量的值不包括在串行化的表示中，也就是说没法持久化。
因为读写Map是根据Object.hashcode()来确定从table[i]读/写
而Object.hashcode()是native方法, 不同的JVM里可能是不一样的
比如向HashMap存一个键值对entry, key为字符串"guowuxin", 在第一个java程序里, "guowuxin"的hashcode()为1, 存入table【1】
在另一个JVM程序里, "guowuxin" 的hashcode()有可能就是2, 存入table【2】
如果用默认的串行化(Entry[] table不用transient), 那么这个HashMap从第一个java程序里通过串行化导入第二个JVM环境之后, 其内存分布是一样的. 这就不对了.
HashMap现在的readObject和writeObject是把内容 输出/输入, 把HashMap重新生成出来.
所以HashMap自己实现了readObject和writeObject
另外因为 HashMap 中的存储数据的数组数据成员中，数组还有很多的空间没有被使用，没有被使用到的空间被序列化没有意义。所以需要手动使用 writeObject() 方法，只序列化实际存储元素的数组。

红黑树是O(logn)，链表是O(n)，大于等于7就转成红黑树，小于7时候O(longn)要大。

public class BB {
    int i = 1;
    String s =  "发大V";
    AA dd() {
        return new AA();
    }
    
    class AA{
        AA(){}
        
        void go() {
            System.out.println(s);//直接使用外部类的属性
        }
    } 
    
    public static void main(String[] args) {
        AA ss = new BB().dd();
        ss.go();//发大V
        
    }
}

我们知道java.util.HashMap不是线程安全的，因此如果在使用迭代器的过程中有其他线程修改了map，那么将抛出ConcurrentModificationException，这就是所谓fail-fast策略。

“重写equals时也要同时覆盖hashcode”：是根据key对象的hashcode判断在数组哪个位置，然后e.hash == hash && ((k = e.key) == key || (key != null && key.equals(k)))

put(new Person(“haha”),“三三四四”)    ;
get（new Person(“haha”)）

public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

public V put(K key, V value) { 
        return putVal(hash(key), key, value, false, true);
    }

Get一个对象时候：对象相等，hashcode和equals方法相等。对象不相等，hashcode相等equals不能相等。hashcode不相等equals随意也不会冲突。

“重写equals时也要同时覆盖hashcode”是为了保证能够get到这个对象。

加载因子越大,填满的元素越多,好处是,空间利用率高了,但:冲突的机会加大了.链表长度会越来越长,查找效率降低。

加载因子越小,填满的元素越少,好处是:冲突的机会减小了,但:空间浪费多了.表中的数据将过于稀疏（很多空间还没用，就开始扩容了）冲突的机会越大,则查找的成本越高.

转为红黑树节点后，链表的结构还存在，通过next属性维持，红黑树节点在进行操作是都会维护链表的结构，并不是转为红黑树节点，链表结构就不存在了。
在红黑树上，叶子节点可能有next节点，因为红黑树的结构跟链表的结构是互不影响的，不会因为叶子节点就说该节点没有next节点了。

HashMap和Hashtable的区别：

HashMap允许key和value为null，Hashtable不允许。

HashMap的默认初始容量为16，Hashtable为11。

HashMap的扩容为原来的2倍，Hashtable的扩容为原来的2倍加1。

HashMap是非线程安全的，Hashtable是线程安全的。

HashMap的hash值重新计算过，Hashtable直接使用hashCode。

HashMap去掉了Hashtable中的contains方法。

HashMap继承自AbstractMap类，Hashtable继承自Dictionary类。

//java 8中的散列值优化函数 
static final int hash(object key) { 
int h; 
return (key == null) ? 0 : (h = key.hashcode()) ^ (h >>> 16); //key.hashcode()为哈希算法，返回初始哈希值 
}

大家都知道上面代码里的key.hashCode()函数调用的是key键值类型自带的哈希函数，返回int型散列值。理论上散列值是一个int型，如果直接拿散列值作为下标访问HashMap主数组的话，考虑到2进制32位带符号的int表值范围从-2147483648到2147483648。前后加起来大概40亿的映射空间。只要哈希函数映射得比较均匀松散，一般应用是很难出现碰撞的。

右位移16位，正好是32bit的一半，自己的高半区和低半区做异或，就是为了混合原始哈希码的高位和低位，以此来加大低位的随机性。而且混合后的低位掺杂了高位的部分特征，这样高位的信息也被变相保留下来。

posted @ 2019-07-21 12:49 无天666 阅读(278) 评论(0) 收藏举报

刷新页面返回顶部

672530440

HashMap源码1

公告