浅析前端开发中应该了解的数据结构

一、数据结构概念

　　数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成。

　　常用的数据结构有：数组，栈，链表，队列，树，图，堆，散列表等，如图所示：

　　每一种数据结构都有着独特的数据存储方式，不同种类的数据结构适合不同种类的应用，部分数据结构甚至是为了解决特定问题而设计出来的。正确的数据结构选择可以提高算法的效率。

二、数据结构简介

　　下面为大家介绍它们的结构和优缺点。

1、数组

　　定义：数组是由相同类型的元素的集合所组成的数据结构，分配一块连续的内存来存储。利用元素的索引可以计算出该元素对应的存储地址。

　　优点：

（1）按照索引查询元素速度快

（2）按照索引遍历数组方便

　　缺点：

（1）数组的大小固定后就无法扩容了

（2）数组只能存储一种类型的数据

　　扩展：

（1）JavaScript数组中的默认存储值是undefined，其它编程语言数组的默认存储值是0或者是垃圾数据

（2）与其它的编程语言不同，JavaScript可以访问数组中不存在的索引，会返回undefined，而其它的编程语言会报错或返回垃圾数据

（3）JavaScript可以存储不同类型的数据，而其它的编程语言只能存储一种数据类型的数据

（4）当JavaScript中数组的存储空间不够用时，它会自动扩容，而其它的语言数组的大小是固定的，一旦定义了，就无法改变

（5）JavaScript中分配给数组的存储空间是不连续的，而其他编程语言中分配给数组的存储空间是连续的

　　适用场景频繁查询，对存储空间要求不大，很少增加和删除的情况。

2、栈

　　定义：栈又称堆叠,是一种特殊的线性表，仅能在线性表的一端操作，栈顶允许操作，栈底不允许操作。栈的特点是：先进后出，或者说是后进先出（LIFO, Last In First Out），从栈顶放入元素的操作叫入栈，取出元素叫出栈；

　　适用场景：栈的结构就像一个集装箱，越先放进去的东西越晚才能拿出来，所以，栈常应用于实现递归功能方面的场景，例如斐波那契数列、反转列表顺序、撤销一个或一系列操作

3、队列

　　定义：队列与栈一样，也是一种线性表，不同的是，队列可以在一端添加元素，在另一端取出元素，也就是：先进先出。从一端放入元素的操作称为入队，取出元素为出队

　　适用场景因为队列先进先出的特点，在多线程阻塞队列管理中非常适用。

4、堆

　　定义：堆是一种比较特殊的数据结构，可以被看做一棵树的数组对象堆(heap)又被为优先队列(priority queue)。尽管名为优先队列，但堆并不是队列。因为队列中允许的操作是先进先出（FIFO），在队尾插入元素，在队头取出元素。而堆虽然在堆底插入元素，在堆顶取出元素，但是堆中元素的排列不是按照到来的先后顺序，而是按照一定的优先顺序排列的。在堆中最顶端的那一个节点，称作根节点（root node），根节点本身没有母节点（parent node）。

　　堆的一个经典的实现是完全二叉树(complete binary tree)，这样实现的堆称为二叉堆(binary heap)。

　　这里来说明一下满二叉树的概念与完全二叉树的概念。

　　满二叉树：除了叶子节点，所有的节点的左右孩子都不为空，就是一棵满二叉树，如下图。

　　可以看出：满二叉树所有的节点都拥有左孩子，又拥有右孩子。完全二叉树：不一定是一个满二叉树，但它不满的那部分一定在右下侧，如下图

5、链表

　　定义：链表是物理存储单元上非连续的、非顺序的存储结构，数据元素的逻辑顺序是通过链表的指针地址实现，每个元素包含两个结点，一个是存储元素的数据域 (内存空间)，另一个是指向下一个结点地址的指针域。

优点

链表是很常用的一种数据结构，不需要初始化容量，可以任意加减元素；
添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可，所以添加，删除很快；

缺点

因为含有大量的指针域，占用空间较大；
查找元素需要遍历链表来查找，非常耗时。

适用场景数据量较小，需要频繁增加，删除操作的场景

　　根据指针的指向，链表能形成不同的结构，例如单链表，双向链表，循环链表等。

循环链表的特点

　　和单链表相比，循环链表的优点是从链尾到链头比较方便，当要处理的数据具有环型结构特点时，适合采用循环链表。

双向链表的特点

与单链表对比，双链表需要多一个指针用于指向前驱节点，因此如果存储同样多的数据，双向链表要比单链表占用更多的内存空间
双链表的插入和删除需要同时维护 next 和 prev 两个指针。
双链表中的元素访问需要通过顺序访问，支持双向遍历，这就是双向链表操作的灵活性根本

双向链表的基本操作

添加元素

　　与单向链表相对比双向链表可以在 O(1) 时间复杂度搞定，而单向链表需要 O(n) 的时间复杂度。

　　双向链表的添加元素包括头插法和尾插法。

　　头插法：将链表的左边称为链表头部，右边称为链表尾部。头插法是将右边固定，每次新增的元素都在左边头部增加。

　　尾插法：将链表的左边称为链表头部，右边称为链表尾部。尾插法是将左边固定，每次新增都在链表的右边最尾部。

查询元素

　　双向链表的灵活处就是知道链表中的一个元素结构就可以向左或者向右开始遍历查找需要的元素结构。因此对于一个有序链表，双向链表的按值查询的效率比单链表高一些。因为，我们可以记录上次查找的位置 p，每次查询时，根据要查找的值与 p 的大小关系，决定是往前还是往后查找，所以平均只需要查找一半的数据。

删除元素

在实际的软件开发中，从链表中删除一个数据无外乎这两种情况：

删除结点中“值等于某个给定值”的结点
删除给定指针指向的结点

　　对于双向链表来说，双向链表中的结点已经保存了前驱结点的指针，删除时不需要像单链表那样遍历。所以，针对第二种情况，单链表删除操作需要 O(n) 的时间复杂度，而双向链表只需要在 O(1) 的时间复杂度。

6、树结构

　　定义：树是一种数据结构，它是由n（n>=1）个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

特点

每个节点有零个或多个子节点；
没有父节点的节点称为根节点；
每一个非根节点有且只有一个父节点；
除了根节点外，每个子节点可以分为多个不相交的子树；

　　树的不同部分被称为：

根节点/父节点(Root Node/parent Node)：在其下有子节点的节点。
叶节点(leaf nodes)：没有与其关联的子节点的节点。
边(edges)：两个节点之间的链接。

　　树的一些定义：

路径：从根节点到目标节点所需的节点列表。
树的高度：在根节点和最远的叶节点之间形成最大路径的节点数。

　　根据数据结构可以分为不同类型的树：

二叉树：二叉树是树的特殊一种，它添加，删除元素都很快，并且在查找方面也有很多的算法优化，所以，二叉树既有链表的好处，也有数组的好处，是两者的优化方案，在处理大批量的动态数据方面非常有用，它们还用于创建二进制搜索树。他的的一种潜在用例是压缩算法。具有如下特点：

每个结点最多有两颗子树，结点的度最大为2。
左子树和右子树是有顺序的，次序不能颠倒。
即使某结点只有一个子树，也要区分左右子树。

二分搜索树：也称为二叉搜索树、有序二叉树（ordered binary tree）或排序二叉树（sorted binary tree），是指一棵空树或者具有下列性质的二叉树

若任意节点的左子树不空，则左子树上所有节点的值均小于它的根节点的值；
若任意节点的右子树不空，则右子树上所有节点的值均大于或等于它的根节点的值；
任意节点的左、右子树也分别为二叉查找树；

深度优先搜索（DFS）：这是查找树的一种方式。它的工作方式是，首先先遍历整个左侧，然后回溯到最后访问的父级，然后移至右侧的子树。

　　遍历结果：A-> B-> C-> D-> E。节点的顺序由DFS方法确定，也可以按相反的顺序遍历。

7、图

　　定义：图是由结点的有穷集合V和边的集合E组成。其中，为了与树形结构加以区别，在图结构中常常将结点称为顶点，边是顶点的有序偶对，若两个顶点之间存在一条边，就表示这两个顶点具有相邻关系。

　　按照顶点指向的方向可分为无向图和有向图：图是一种比较复杂的数据结构，在存储数据上有着比较复杂和高效的算法，分别有邻接矩阵、邻接表、十字链表、邻接多重表、边集数组等存储结构

适用场景

　　图是非常通用的，因为它们可用于表示实体相互连接的几乎所有场景。我说的是用例，范围从网络布局到基于微服务的体系结构，再到真实世界的地图，再到你可以想象的任何事物。

　　如此之多，以至于整个数据库引擎都基于图的概念（例如Neo4J是一种非常流行的引擎）。我们刚刚涵盖的树中的所有概念（例如边，节点，路径等）在这里仍然有效。

8、散列表

　　散列表，也叫哈希表，是根据关键码和值 (key和value) 直接进行访问的数据结构，通过key和value来映射到集合中的一个位置，这样就可以很快找到集合中的对应元素。

　　记录的存储位置=f(key)

　　这里的对应关系 f 成为散列函数，又称为哈希 (hash函数)，而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字，然后就将该数字对数组长度进行取余，取余结果就当作数组的下标，将value存储在以该数字为下标的数组空间里，这种存储空间可以充分利用数组的查找优势来查找元素，所以查找的速度很快。它允许存储键值对并快速检索它们（有人会说它的复杂度为O（1）最佳情况），是非常惊人的。哈希表在应用中也是比较常见的，就如Java中有些集合类就是借鉴了哈希原理构造的，例如HashMap，HashTable等。

优点

利用hash表的优势，对于集合的查找元素时非常方便；

缺点

因为哈希表是基于数组衍生的数据结构，在添加删除元素方面是比较慢的；

适用场景哈希表的应用场景很多，当然也有很多问题要考虑，比如哈希冲突的问题，如果处理的不好会浪费大量的时间，导致应用崩溃。如果实施得当，该结构将非常有效，以至于广泛用于诸如数据库索引（通常在需要快速查找操作时将字段设置为索引）等场景，甚至是缓存实现，从而允许快速查找操作以进行检索缓存的内容。正如您可能已经猜到的，如果您希望进行快速且重复的查找，那么这是一个很好的结构。

文章来源于前端进阶之路，作者三余

原文链接：https://mp.weixin.qq.com/s/9tV_8lh2Je-ZDP39UaLcuw

posted @ 2017-07-08 19:40 古兰精阅读(844) 评论(0) 收藏举报

刷新页面返回顶部

古兰精

浅析前端开发中应该了解的数据结构

一、数据结构概念

二、数据结构简介

公告