List-LinkedList、set集合基础增强底层源码分析

List-LinkedList

作者： Stanley 罗昊

【转载请注明出处和署名，谢谢！】

继上一章继续讲解，上章内容：

List-ArreyLlist集合基础增强底层源码分析：https://www.cnblogs.com/StanleyBlogs/p/10396253.html

List-LinkedList

首先，LinkedList底层是一个链表结构，并且是双向链表；

增删快、查询慢

并分为单向链表跟双向链表

单向链表

单向链表，每个元素都称之为一个节点，每个节点都由两部分组成分别是，数据、指向下一个节点的指针；

单向链表每一个节点在内存中存储上、空间位置上、都是无无序的；

链表查询效率较低

单向链表中的每个元素在空间的存储位置上没有规律，也没有顺序，那么在查找某个元素的时候，必须从头节点挨着往后找，直到找到为止；

链表增删效率高

因为链表每个元素在存储的空间是没有顺序的，，删除或者添加某个元素，只需要让指针重新指向即可，不需要将其他元素位移。所以随机增删效率较高

双向链表

双向链表的查找方式是交替查找，就是左表查找一个，右边查找一个，最终左边跟右边谁先返回，那么谁就先找到；

双向链表就是双向开工，最后离谁近我返回谁，说白就是谁查的次数最少，我返回谁；

LinkedList底层讲解

那么，链表结构在底层保存的是什么结构呢？

Node（节点），它底层保存的是Node，一个节点一个节点的；

我们点进源码后我们开始进行分析：

    transient int size = 0;

　　我们点进源码后，看到的第一个属性就是 size =0；

这句话的意思就是，LinkedList初始值是0，也就是，你没有给它任何数据的时候，它的长度为0；

再往下看：

   transient Node<E> first;//代表第一个节点 

    /**
     * Pointer to last node.
     * Invariant: (first == null && last == null) ||
     *            (last.next == null && last.item != null)
     */

　　我们看到了Node，Node这个对象，就代表链表中的每一个元素；

我们点进去看一下，Node里面有什么：

 private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;

        Node(Node<E> prev, E element, Node<E> next) {
            this.item = element;
            this.next = next;
            this.prev = prev;
        }
    }

　　我们点进去后，第一行有一个E，这个E是干什么的呢？

这个E就代表，本节点的信息，比如说你这里插入的数据的类型都是String类型，那么这个节点的类型就是String，另外一个节点可能是int类型，double类型，那么节点类型也就不同，所以这个E是个泛型；

再往下走，有一个next跟一个prev；

next代表下一个，prev代表前一个；

为什么会有这两个呢，是因为便于双向查找的时候能够找到对方；

    transient Node<E> last;//代表最后一个节点

    /**
     * Constructs an empty list.
     */

我们看到在底层源码中，还有一个代表最后一个节点的方法，我们发现，两个方法分别声明，为什么不写在一起呢？

因为，最后一个节点的信息，跟中间的信息保存的不一样！

第一个节点只需要保存下一个节点，而最后一个节点只需要保存上一个节点；

总结：

我需要知道的是LinkedList是一个链表结构，链表结构的特点是查询慢增删快；

还有链表结构的每一个元素都是一个Node（节点），而Node的底层，就是一个双向链表；

每个Node都会存储三个信息，prev item next；

Set集合

set集合特点：

无序、不重复；

这里的无序是指，没有添加顺序；

它有两个实现类，分别是 HashSet、TreeSet

首先我们先关注HashSet；

HashSet

创建一个HashSet集合：

Set<泛型> 对象名 = new HashSet<String>();

添加元素:

对象名.add("");

下面我们就做一些例子来更好的讲一下HashSet集合；

1.创建一个HashSet赋值，并用增强for循环打印，添加相同元素观察状态；

Set<String> set01 = new HashSet<String>();

set.add("hh");

set.add("aa");

set.add("cc");

set.add("hh");

for(String str : set01){

syso(str);

}

执行结果我们会发现，我们明明添加进去了两个，为什么却值打印出来一个hh？

这就是HashSet的特性，值不能重复；

那么它是如何做到的呢，它是如何保证元素不重复的？

我们现在可以假设一下HashSet的底层是什么，我们假设它底层是一个数组，那么，数组是如何做到元素不重复的呢？

是不是要从头开始遍历，直到遍历结束后发现这个元素没有出现过，那么就表明这个元素确实为唯一未重复的；

但是，如果数组的长度非常长，这个时候，你这样的方法，还能行得通吗？当然不行了，因为性能太低了！

它的底层确实是数组，但是，缺不是这样的遍历方式，而是hash算法；

所有元素存储的时候，存的是hashcode的元素值，那个这个值是可以当成它索引；

hash算法

*任何一种hashcode的算法都无法达到绝对的完美*

*必然会存在hashcode值的冲突*

假如我现在要添加一个元素，加进来之后首先会计算这个值的hashcode值，如果这个hashcode值 = 50，那我就把你这个元素存到下标为50的数组的对应位置上；

这个时候又假设又存进来一个“bb”，首先第一步还是需要先计算它的hashcode值，假设bb的hashcode值 = 25，那么，它就会被分配到下标为25的数组里；

这个时候我又存进来了一个元素“cc”，当你插入cc元素的时候，首先还是需要先算一个你这个元素的hashcode值，假设这个cc还等与25，那么这个cc是不是也要去找相对应的下标为25的位置了，但是发现，这个25这个位置已经被bb占用了，这个时候就会触发底层的equals方法进行内容比较，如果内容相同，则不让你插入，如果不同，那么就会以列表的方式进行插入，就是挂在“bb”的下面；

在java1.5的时候，以上这个结构被称之为，hashset桶表+链表；

在java1.8点时候，以上转增结构被称之为，桶表+链表+二叉树；

为什么要加二叉树？

假设有许多hashcode的值 = 25，那么你是不是就需要一直的往下挂呀；

大家都知道链表是有缺陷的，就是查找慢！那你查的时候，是不是就是从第一个开始遍历，去寻找啊，假设这个元素刚好在链表的最末端，那么你需要查多久啊；

所以到1.8之后，为了避免这种情况出现，所以它对这个链表做了一个优化，链表深度超过8的时候，就会转化成二叉树

hashset底层代码分析

进去之后，首先第一句话：

    private transient HashMap<E,Object> map;

    // Dummy value to associate with an Object in the backing Map

　　看到这个map，就说明set跟map是有一定关系的，你说白了set的底层实现，事实上就是map的底层实现；

看一下set的底层构造方法：

    public HashSet() {
        map = new HashMap<>();
    }

    /**
     * Constructs a new set containing the elements in the specified
     * collection.  The <tt>HashMap</tt> is created with default load factor
     * (0.75) and an initial capacity sufficient to contain the elements in
     * the specified collection.
     *
     * @param c the collection whose elements are to be placed into this set
     * @throws NullPointerException if the specified collection is null
     */

　　是HashMap；

所以点进去后你会发现，最后还是到了HashMap的底层里面去了；

首先看第一行：

   /**
     * The default initial capacity - MUST be a power of two.
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

　　默认长度是 16；

再往下走：

    /**
     * The maximum capacity, used if a higher value is implicitly specified
     * by either of the constructors with arguments.
     * MUST be a power of two <= 1<<30.
     */
    static final int MAXIMUM_CAPACITY = 1 << 30;

　　这个是最大容量，int的最大值/2；10亿左右

再往下：

    /**
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

这个是默认加载因子；

也就是16元素，到第16*0.75（12）；

也就是到达12个元素即将到达第13个元素的时候，它就开始扩容，并以二倍的速度开始扩的；

再往下看：

 /**
     * The bin count threshold for using a tree rather than list for a
     * bin.  Bins are converted to trees when adding an element to a
     * bin with at least this many nodes. The value must be greater
     * than 2 and should be at least 8 to mesh with assumptions in
     * tree removal about conversion back to plain bins upon
     * shrinkage.
     */
    static final int TREEIFY_THRESHOLD = 8;

这个就是树结构控制；

每个链表达到8之后，就开始自动转化为二叉树结构；

什么是时候会触发链表啊？

hash算法相同的时候会把值相同的放到同一个链表上；

posted @ 2019-04-08 11:43 StanleyBlogs 阅读(421) 评论(0) 收藏举报

Stanley的博客

罗昊的博客

List-LinkedList、set集合基础增强底层源码分析

List-LinkedList

List-LinkedList

单向链表

链表查询效率较低

链表增删效率高

双向链表

LinkedList底层讲解

Set集合

HashSet

hash算法

为什么要加二叉树？

hashset底层代码分析

公告

Stanley的博客

罗昊的博客

List-LinkedList、set集合基础增强底层源码分析

List-LinkedList

List-LinkedList

单向链表

链表查询效率较低

链表增 删 效率高

双向链表

LinkedList底层讲解

Set集合

HashSet

hash算法

为什么要加二叉树？

hashset底层代码分析

公告

链表增删效率高