数据结构与算法(五)：链表

定义

链表是一种物理存储单元上非连续、非顺序的存储结构，数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列结点（链表中每一个元素称为结点）组成，结点可以在运行时动态生成。每个结点包括两个部分：一个是存储数据元素的数据域，另一个是存储下一个结点地址的指针域。链表和数组一样，作为最底层的数据结构，是很多其他数据结构的底层实现，比如可以用链表来实现队列、栈等等。相比数组对连续内存空间的要求限制，链表对内存的使用就更加灵活，它不需要一块连续的内存空间，而是通过指针将一组零散的内存块串联起来。

常见的链表结构

最常见的三种链表结构分别是：单链表，双向链表，循环链表。

单链表

链表通过指针将一组零散的内存块串联在一起，其中每一个内存块就是链表中的一个节点（node），为了所有节点串联起来，节点中不仅要存储数据（data），还需要存储指向下一个节点地址的指针（*next）。结构如下图：

我们习惯把第一个节点成为头节点，最后一个节点称为尾节点。尾节点的next指向null，这样我们就可以通过头节点遍历整条链表，直到尾节点的next为null结束。代码实现如下：

  public class LinkList<T>
    {
        public Node<T> _head { get; set; }
        public Node<T> _tail { get; set; }

        public void Insert(T data)
        {
            if (_head == null)
            {
                _head = new Node<T>();
                _head.data = data;
                _tail = _head;
            }
            else
            {
                var node = new Node<T>();
                node.data = data;
                _tail.next = node;
                _tail = node;
            }
        }

        public List<T> FindAll()
        {
            var list = new List<T>();
            var node = _head;
            while (node != null)
            {
                list.Add(node.data);
                node = node.next;
            }
            return list;
        }

        public void Delete(T data)
        {
            var node = _head;
            var isHead = true;
            var lastNode = new Node<T>();
            while (node != null)
            {
                if (node.data.GetHashCode() == data.GetHashCode())
                {
                    if (isHead)
                    {
                        _head = node.next;
                    }
                    else
                    {
                        lastNode.next = node.next;
                    }
                }
                else
                {
                    isHead = false;
                }
                lastNode = node;
                node = node.next;
            }
        }
    }
    public class Node<T>
    {
        public T data { get; set; }
        public Node<T> next { get; set; }
    }

循环链表

循环链表是单链表的一种变式，唯一的区别就是：尾节点的next不在指向null，而是指向头节点的地址。这样链表就变成了一个环形结构，它的优点就是从链尾到链头比较方便，适合处理具有环形结构特点的数据，比如约瑟夫环问题。

双向链表

双向链表同样是单链表的变式，区别是节点中不仅要存储next指针，还需要存储一个指向上一个节点的指针（*prev），这样就可以实现链表的双向遍历，提高了链表操作的灵活性。

代码实现如下：

 public class LinkList<T>
    {
        public Node<T> _head { get; set; }
        public Node<T> _tail { get; set; }

        public void Insert(T data)
        {
            if (_head == null)
            {
                _head = new Node<T>();
                _head.data = data;
                _tail = _head;
            }
            else
            {
                var node = new Node<T>();
                node.data = data;
                _tail.next = node;
                node.prev = _tail;
                _tail = node;
            }
        }

        public List<T> FindAll()
        {
            var list = new List<T>();
            var node = _head;
            while (node != null)
            {
                list.Add(node.data);
                node = node.next;
            }
            return list;
        }

        public void Delete(T data)
        {
            var node = _head;
            var isHead = true;
            while (node != null)
            {
                if (node.data.GetHashCode() == data.GetHashCode())
                {
                    if (isHead)
                    {
                        _head = node.next;
                    }
                    else
                    {
                        node.prev.next = node.next;
                        node.next.prev = node.prev;
                    }
                }
                else
                {
                    isHead = false;
                }
                node = node.next;
            }
        }
    }
    public class Node<T>
    {
        public T data { get; set; }
        public Node<T> next { get; set; }
        public Node<T> prev { get; set; }
    }

复杂度分析

查询：需要遍历链表，时间复杂度为O(n)
删除：因为删除数据前需要遍历链表找到要删除的节点，所以时间复杂度同样为O(n),单纯的删除操作为O(1)
插入节点：插入到链尾的时间复杂度为O(1)

如何基于链表实现 LRU 缓存淘汰算法

思路是这样的：我们维护一个有序单链表，越靠近链表尾部的结点是越早之前访问的。当有一个新的数据被访问时，我们从链表头开始顺序遍历链表。

如果此数据之前已经被缓存在链表中了，我们遍历得到这个数据对应的结点，并将其从原来的位置删除，然后再插入到链表的头部。
如果此数据没有在缓存链表中，又可以分为两种情况：
- 如果此时缓存未满，则将此结点直接插入到链表的头部；
- 如果此时缓存已满，则链表尾结点删除，将新的数据结点插入链表的头部。

这样我们就用链表实现了一个 LRU 缓存，是不是很简单？现在我们来看下缓存访问的时间复杂度是多少。因为不管缓存有没有满，我们都需要遍历一遍链表，所以这种基于链表的实现思路，缓存访问的时间复杂度为 O(n)。
实际上，我们可以继续优化这个实现思路，比如引入散列表（Hash table）来记录每个数据的位置，将缓存访问的时间复杂度降到 O(1)。这部分的实现我计划在散列表中给出代码实现。