程序员基本功系列1——算法与数据结构基础

1、衡量算法的标准

　　衡量算法的两个维度：时间复杂度和空间复杂度。

（1）时间复杂度

　　时间复杂度一般用大 O 时间复杂度表示，它并不是具体指代码真正执行的时间，而是代码执行时间随着数据规模增长的变化趋势。

　　三个判断方法：

　　　　• 只关注循环执行次数最多的一段代码

　　　　• 加法法则

　　　　• 乘法法则：嵌套代码的时间复杂度等于嵌套内外代码复杂度的乘积

　　几种常见时间复杂度：

　　　　常量阶—O(1)，对数阶—O(logn)，线性阶—O(n)，线性对数阶—O(nlogn)，平方阶或k次方阶—O(n^k)

　　时间复杂度根据情况还分为：最好时间复杂度、最坏时间复杂度、平均时间复杂度、均摊时间复杂度。

（2）空间复杂度

　　常见空间复杂度：O(1)、O(n)、O(n²)

2、数据结构

　　数据结构可以分为：

　　　　线性表：最多只有前后两个方向，包括数组、链表、队列、栈。

　　　　非线性表：二叉树、堆、图。

2.1、数组

　　数组用一组连续的内存空间来存储一组具有相同类型的数据。

　　数组元素访问寻址算法：

　　　　a[i]_address = base_address + i * data_type_size

　　其中：base_address 是内存块首地址，如数组存储的 int 类型，则 data_type_size 为四个字节。

　　数据优点：可以根据下标随机访问，缺点：低效的删除和插入，为了保持连续性，需要做大量的数据迁移。

2.2、链表

　　分为：单向链表、循环链表、双向链表。

　　查询的时间复杂度是 O(n)，插入和删除的时间复杂度是 O(1)。

　　应用案例：双向链表实现 LRU 淘汰算法

　　　　要点：访问时，如果数据不在链表中，直接在头部插入，否则，要先找到数据所在位置，再将数据节点移到头部，要做到时间复杂度 O(1)，可以使用哈希表来存储数据对应的节点指针。

　　链表与数组的比较：

　　　　• 数组需要连续的内存，对于内存要求较高，链表则不需要连续内存，自带动态扩容，但是存在额外的指针（前驱和后驱指针）会增加内存开销，并且频繁的插入和删除更容易产生内存碎片和触发垃圾回收。

　　　　• 数组对于处理器的缓存机制更加友好，更加有利于发挥操作系统缓存行的特性，提升性能。美团《高性能队列》一文中有提及这一点。

　　　　　　缓存行：CPU缓存有多个缓存行组成（Cache line，一般64个字节），CPU从主内存中拉取数据时，会把相邻数据一起拉下来放入到缓存行中。

2.3、栈

　　特性：先进后出

　　可以由数组实现（顺序栈）或链表实现（链表栈）

　　应用案例：

　　　　（1）浏览器页面的前进后退

　　　　　　使用两个栈，X 和 Y，把首次浏览的页面依次压入栈 X，当点击后退按钮时，再依次从栈 X 中出栈，并将出栈的数据依次放入栈 Y。当点击前进按钮时，我们依次从栈 Y 中取出数据，放入栈 X 中。当栈 X 中没有数据时，那就说明没有页面可以继续后退浏览了。当栈 Y 中没有数据，那就说明没有页面可以点击前进按钮浏览了。　　　

　　　　（2）表达式运算

　　　　　　例如 3+5*8-6 这个表达式。实际上编译器就是通过两个栈实现的，其中一个保存操作数的栈，另一个是保存运算符的栈。我们从左向右遍历表达式，当遇到数字，我们就直接压入操作数栈；当遇到运算符，就与运算符栈的栈顶元素进行比较。如果比运算符栈顶元素的优先级高，就将当前运算符压入栈；如果比运算符栈顶元素的优先级低或者相同，从运算符栈中取栈顶运算符，从操作数栈的栈顶取 2 个操作数，然后进行计算，再把计算完的结果压入操作数栈，继续比较。　　　

　　　　（3）有效括号的判断

　　　　　　假设表达式中只包含三种括号，圆括号 ()、方括号[]和花括号{}，并且它们可以任意嵌套。比如，{[] ()[{}]}或[{()}([])]等都为合法格式，而{[}()]或[({)]为不合法的格式。给一个包含三种括号的表达式字符串，如何检查它是否合法呢？

　　　　　　也可以用栈来解决。用栈来保存未匹配的左括号，从左到右依次扫描字符串。当扫描到左括号时，则将其压入栈中；当扫描到右括号时，从栈顶取出一个左括号。如果能够匹配，比如“(”跟“)”匹配，“[”跟“]”匹配，“{”跟“}”匹配，则继续扫描剩下的字符串。如果扫描的过程中，遇到不能配对的右括号，或者栈中没有数据，则说明为非法格式。当所有的括号都扫描完成之后，如果栈为空，则说明字符串为合法格式；否则，说明有未匹配的左括号，为非法格式。

2.4、队列

　　特性：先进先出

　　也可以由数组或链表实现，此外还有阻塞队列，并发队列，在队列数据结构的基础上增加了入队和出队的阻塞操作，以及多线程下的同步机制。

3、算法

3.1、递归思想

　　递归不是具体的算法，但在很多算法都会用到，比如 DFS深度优先搜索、前中后序二叉树遍历等，所以理解好递归是很必要的。

　　递归需要满足的三个条件：

　　　　• 一个问题的解可以分解为几个子问题的解

　　　　• 这个问题与分解的子问题，除了数据规模求解的思路一样

　　　　• 存在终止条件

　　写递归代码的关键：

　　　　• 写出递归公式 • 找到终止条件

　　理解递归要注意的点：

　　　　• 只要将问题抽象成递推公式，千万不要去想一层层的调用关系

　　　　• 要避免重复的计算，如：f(5) = f(4)+f(3)，f(4) = f(3)+f(2)，其中 f(3) 就会被计算多次。　

posted @ 2022-01-28 14:26 jingyi_up 阅读(90) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 程序员基本功系列2——排序算法

· 程序员基本功系列6——堆

· 基础篇—— 数据结构与算法

· 数据结构与算法

· 数据结构与算法: 基础知识

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了
· 上周热点回顾（2.24-3.2）

公告

昵称： jingyi_up
园龄： 4年11个月
粉丝： 6
关注： 8

+加关注

2025年3月

日

一

二

三

四

五

六

jingyi_up

程序员基本功系列1——算法与数据结构基础

1、衡量算法的标准

2、数据结构

2.1、数组

2.2、链表

2.3、栈

2.4、队列

3、算法

3.1、递归思想

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论