浅析Java源码之HashMap外传-红黑树Treenode(已鸽)
(这篇文章暂时鸽了,有点理解不能,点进来的小伙伴可以撤了)
刚开始准备在HashMap中直接把红黑树也过了的,结果发现这个类不是一般的麻烦,所以单独开一篇。
由于红黑树之前完全没接触过,所以这篇博客相当于探索(其实之前的博客都是边看源码边写的,全是探索)。
红黑树没见过,树我还是知道的,所以先上一张帅图:
红黑树在这个基本树的基础上还多了red,暂时不知道啥意思,慢慢探索。
先来一个类总览:
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> { // ... }
这个红黑树继承了一个另外一个类中的静态内部类:
static class Entry<K,V> extends HashMap.Node<K,V> {}
这个类也继承了一个静态内部类,竟然是HashMap中的Node,真是无语的循环!
这些东西虽然绕来绕去,但是总的特性就是两个字:链表!!!!!!!!!
变量
废话不多说,首先来看一个这个类的内部变量:
// 父节点 TreeNode<K,V> parent; // 左右子节点 TreeNode<K,V> left; TreeNode<K,V> right; // ??? TreeNode<K,V> prev; // 红黑树的精髓 => red! boolean red;
这些节点的意思都比较直接,按理讲在正常的树中只有父、左、右三个,这里的prev和red暂时不清楚干嘛用的。
构造函数
接下来是构造函数
TreeNode(int hash, K key, V val, Node<K,V> next) { super(hash, key, val, next); }
super!然后我跑去看了下LinkedHashMap.Entry的构造函数,还是super!!!!
绕了一圈,最后还是回到了Node的构造函数,如下:
Node(int hash, K key, V value, Node<K,V> next) { this.hash = hash; this.key = key; this.value = value; this.next = next; }
没啥好讲的。
需要注意的是,静态内部类都是作为工具来使用的,所以不从常规的添加节点、查询来讲解,直接从链表转红黑树的方法入手,看到什么方法讲什么方法,Let's go!
// tab为HashMap的数组 final void treeify(Node<K,V>[] tab) { TreeNode<K,V> root = null; // 这里的this是需要树转换数组索引处的第一个链表元素 for (TreeNode<K,V> x = this, next; x != null; x = next) { // 依次往上获取节点 next = (TreeNode<K,V>)x.next; x.left = x.right = null; // 第一个元素被设置为树的根节点 if (root == null) { x.parent = null; x.red = false; root = x; } else { K k = x.key; int h = x.hash; Class<?> kc = null; for (TreeNode<K,V> p = root;;) { int dir, ph; K pk = p.key; // 根据hash值的大小区分左右 if ((ph = p.hash) > h) dir = -1; else if (ph < h) dir = 1; // 当出现hash碰撞 暂时不管这个 else if ((kc == null && (kc = comparableClassFor(k)) == null) || (dir = compareComparables(kc, k, pk)) == 0) dir = tieBreakOrder(k, pk); // 这里的xp变成了root TreeNode<K,V> xp = p; // 这个表达式不加括号看起来真是恶心 // 根据dir判断root.left或者root.right是否为null if ((p = (dir <= 0) ? p.left : p.right) == null) { // 设置下一个元素的parent为root x.parent = xp; // 设置root的left或right if (dir <= 0) xp.left = x; else xp.right = x; root = balanceInsertion(root, x); break; } } } } moveRootToFront(tab, root); }
在前面的转换中,其实参数tab并没有用上,所以暂时只需要关注链表本身。
在balanceInsertion方法之前,只完成了两件事:
1、将链表的第一个元素设置为根节点
2、将第二个元素的hash与根节点做比较,然后设置根节点的left或right为该元素
画个帅图:
接下来看balanceInsertion方法做了什么,该方法接受两个参数:根节点、根节点的left(right)节点。
这个方法真长,让我深深的吸了一口气。
static <K, V> TreeNode<K, V> balanceInsertion(TreeNode<K, V> root,TreeNode<K, V> x) { // 红属性 x.red = true; // xp => x的父节点 // xpp => xp的父节点 // xppl => xpp.left // xppr => xpp.right for (TreeNode<K, V> xp, xpp, xppl, xppr;;) { // 当x为根节点时 // 这时xp已经被赋值 xp => root if ((xp = x.parent) == null) { x.red = false; return x; } // 根节点red为false 所以直接返回root else if (!xp.red || (xpp = xp.parent) == null) return root; // more code... } }
很遗憾,返回的特别快,这里的x为根节点的子节点,而根节点的父节点为null,所以这里直接返回root,返回后break,进入下一个循环。
总的来说,这个函数在第一次什么都没有做。
下一次循环时,x为链表中第三个元素,这里就存在一种新情况:dir的值。
首先当dir的值与上次不同时,我们假设在第二次判断中,x的hash值小于根节点root,于是dir为-1,这样就有:
xp.left = x;
而第三次,x的hash值比根节点大,而root.right此时仍为null,所以有
xp.right = x;
这样,根节点的两个儿子就集齐了。
另外一种情况就是dir的值与上次相同,此时p.left即root.left不为null,所以会进入下一轮内循环。此时的p不再是root,而是root.left,即第二个链表元素。
同样,第二个链表元素作为父节点与当前节点的hash作比较,然后设置对应的left/right。
此时,balanceInsertion函数就会进入下一个判断分支:
static <K, V> TreeNode<K, V> balanceInsertion(TreeNode<K, V> root,TreeNode<K, V> x) { // 红属性 x.red = true; for (TreeNode<K, V> xp, xpp, xppl, xppr;;) { if ((xp = x.parent) == null) {/**/} else if (!xp.red || (xpp = xp.parent) == null){/**/ } // 此时xpp为root 父元素正好等于root.left if (xp == (xppl = xpp.left)) { // 此时xpp.right还没有值 if ((xppr = xpp.right) != null && xppr.red) { // ... } else { if (x == xp.right) { // ... } if (xp != null) { // ... } } } else { // ... } } }
这里的分支特别多。。。先看看当前的情况,并假设2次都是left,父、父父均无右节点,如图:
一个一个情况的讨论,反正基本的塞节点已经明白了。这种情况下,会进入如下分支:
if (xp == (xppl = xpp.left)) { // 此时xpp.right还没有值 if ((xppr = xpp.right) != null && xppr.red) { // ... } else { if (x == xp.right) { // ... } if (xp != null) { // 父节点黑了 xp.red = false; if (xpp != null) { // 父父节点红了 xpp.red = true; root = rotateRight(root, xpp); } } } } else { // ... }
这种情况下,将父节点置黑,父父节点置红,并调用另外一个方法rotateRight。
直接看这个方法,接受两个参数:根节点、父父节点(还是root):
static <K,V> TreeNode<K,V> rotateRight(TreeNode<K,V> root,TreeNode<K,V> p) { TreeNode<K,V> l, pp, lr; if (p != null && (l = p.left) != null) { // p.left = l.right if ((lr = p.left = l.right) != null) lr.parent = p; // l.parent = p.parent if ((pp = l.parent = p.parent) == null) (root = l).red = false; else if (pp.right == p) pp.right = l; else pp.left = l; l.right = p; p.parent = l; } return root; }
这个函数应该是叫做向右翻转红黑树,在理解的时候尽量不要把p当做根节点,而是一个普通的节点。
另外,这里就直接讲解各种情况下的翻转效果。
每一个if语句中的赋值都会改变树的结构,这里不太好讲,用图来一步一步解释,当前例子:
可见,翻转后,原来的root被转移到了l的右边,l变成了新的root且red被置false,函数返回新的root。
现在讨论更加普遍的情况,首先看在什么情况下会调用右翻转,将上一个函数中的第一个判断分支抽出如下:
// true xp == (xppl = xpp.left) // false (xppr = xpp.right) != null && xppr.red // true xp != null // true xpp != null
false代表这是else分支。
1、父元素为父父元素的left
2、父父元素的right为null或者父父元素的red为真
3、父元素及父父元素均不为null
很明显,上面的翻转符合这个条件,这里还有另外两种情况,即:
、
针对这两种情况的翻转给出对应的结果图:
、
可以看出,在p为根节点时,l会被转换为新的根节点,并且有:
l.right = p;
p.left = l.right
然而,在p不为根节点时,情况稍微会不一样:
这种情况下不会根节点替换,仅仅是p与l进行换位。
下面来看第二个分支:
// false xp == (xppl = xpp.left) // false xppl != null && xppl.red // true x == xp.left
即:
1、父元素为父父元素的right
2、父父元素的left为null或者red为真
3、当前元素为父元素的left
这里的参数不太一样:
root = rotateRight(root, x = xp);
直接看图吧!
我要疯了!!!!
技术太渣,暂时不搞这个数据结构。。。