数据结构--线性表和链表的基础知识

近期准备重新学习一下常用数据结构和基本算法，并计划将这些内容的只是做一个整理和归类，准备慢慢写一个常用数据结构与基本算法的系列博文，博文列表参见：常用数据结构与基本算法博文系列，目前内容还比较少，后续慢慢补充。本文主要内容是介绍数据结构--线性表和链表的基础知识。

一线性表概述

1.1 线性表概念

线性表，全名为线性存储结构。使用线性表存储数据的方式可以这样理解，即“把所有数据用一根线儿串起来，再存储到物理空间中”。

如上图所示，这是一组具有“一对一”关系的数据，我们接下来采用线性表将其储存到物理空间中。首先，用“一根线儿”把它们按照顺序“串”起来，如图下图所示：

1.2 线性表存储结构

上图中，左侧是“串”起来的数据，右侧是空闲的物理空间。把这“一串儿”数据放置到物理空间，我们可以选择以下两种方式，如下图所示。

图 3a) 是多数人想到的存储方式，而图 3b) 却少有人想到。我们知道，数据存储的成功与否，取决于是否能将数据完整地复原成它本来的样子。如果把图 3a) 和图 3b) 线的一头扯起，你会发现数据的位置依旧没有发生改变（和图 1 一样）。因此可以认定，这两种存储方式都是正确的。上图中我们可以看出，线性表存储数据可细分为以下 2 种：

如图 3a) 所示，将数据依次存储在连续的整块物理空间中，这种存储结构称为顺序存储结构（简称顺序表）；
如图 3b) 所示，数据分散的存储在物理空间中，通过一根线保存着它们之间的逻辑关系，这种存储结构称为链式存储结构（简称链表）；

将具有“一对一”关系的数据“线性”地存储到物理空间中，这种存储结构就称为线性存储结构（简称线性表），线性表存储结构可细分为顺序存储结构和链式存储结构。使用线性表存储的数据，如同向数组中存储数据那样，要求数据类型必须一致，也就是说，线性表存储的数据，要么全不都是整形，要么全部都是字符串。一半是整形，另一半是字符串的一组数据无法使用线性表存储。（有一些弱类型编程语言（如python、MATLAB等）中的数组或者列表中元素的数据类型可以不一致，这都是在我们今天讲的基础上进行扩展的）。

1.3 前驱和后继

数据结构中，一组数据中的每个个体被称为“数据元素”（简称“元素”）。例如，图 1 显示的这组数据，其中 1、2、3、4 和 5 都是这组数据中的一个元素。另外，对于具有“一对一”逻辑关系的数据，我们一直在用“某一元素的左侧（前边）或右侧（后边）”这样不专业的词，其实线性表中有更准确的术语：

某一元素的左侧相邻元素称为“直接前驱”，位于此元素左侧的所有元素都统称为“前驱元素”；
某一元素的右侧相邻元素称为“直接后继”，位于此元素右侧的所有元素都统称为“后继元素”；

以图 1 数据中的元素 3 来说，它的直接前驱是 2 ，此元素的前驱元素有 2 个，分别是 1 和 2；同理，此元素的直接后继是 4 ，后继元素也有 2 个，分别是 4 和 5。如下图4 所示：

二顺序表

2.1 顺序表的概念

顺序表，全名顺序存储结构，是线性表的一种。在前面的内容中我们提到，线性表用于存储逻辑关系为“一对一”的数据，顺序表自然也不例外。不仅如此，顺序表对数据的物理存储结构也有要求。顺序表存储数据时，会提前申请一整块足够大小的物理空间，然后将数据依次存储起来，存储时做到数据元素之间不留一丝缝隙。例如，使用顺序表存储集合 {1,2,3,4,5}，数据最终的存储状态如下图所示：

由此我们可以得出，将“具有 '一对一' 逻辑关系的数据按照次序连续存储到一整块物理空间上”的存储结构就是顺序存储结构。通过观察上图中数据的存储状态，我们可以发现，顺序表存储数据同数组非常接近。其实，顺序表存储数据使用的就是数组。

2.2 顺序表的基本操作

顺序表的基本操作包括顺序表的初始化、插入元素、删除元素、更改元素、查找元素等。这些基本操作的很简单，就不一一解释了，具体代码后续加上。

三链表

3.1 链表的概念

链表，别名链式存储结构或单链表，用于存储逻辑关系为 "一对一" 的数据。与顺序表不同，链表不限制数据的物理存储状态，换句话说，使用链表存储的数据元素，其物理存储位置是随机的。例如，使用链表存储 {1,2,3}，数据的物理存储状态如下图所示：

我们看到，上图根本无法体现出各数据之间的逻辑关系。对此，链表的解决方案是，每个数据元素在存储时都配备一个指针，用于指向自己的直接后继元素。如下图所示，数据元素随机存储，并通过指针表示数据之间逻辑关系的存储结构就是链式存储结构。

3.2 链表的节点

从上图可以看到，链表中每个数据的存储都由以下两部分组成，即链表中存储各数据元素的结构如下图所示：

数据元素本身，其所在的区域称为数据域；
指向直接后继元素的指针，所在的区域称为指针域；

上图所示的结构在链表中称为节点。也就是说，链表实际存储的是一个一个的节点，真正的数据元素包含在这些节点中，如下图所示：

3.3 链表的组成要素

其实，上图所示的链表结构并不完整。一个完整的链表需要由以下几部分构成：

头指针：一个普通的指针，它的特点是永远指向链表第一个节点的位置。很明显，头指针用于指明链表的位置，便于后期找到链表并使用表中的数据；
节点：链表中的节点又细分为头节点、首元节点和其他节点：
- 头节点：其实就是一个不存任何数据的空节点，通常作为链表的第一个节点。对于链表来说，头节点不是必须的，它的作用只是为了方便解决某些实际问题；
- 首元节点：由于头节点（也就是空节点）的缘故，链表中称第一个存有数据的节点为首元节点。首元节点只是对链表中第一个存有数据节点的一个称谓，没有实际意义；
- 其他节点：链表中其他的节点；