算法一:高速排序算法
高速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比較。在最坏状况下则须要Ο(n2) 次比較,但这样的状况并不常见。其实,高速排序通常明显比其它Ο(n log n) 算法更快,由于它的内部循环(inner loop)能够在大部分的架构上很有效率地被实现出来。
高速排序使用分治法(Divide and conquer)策略来把一个串行(list)分为两个子串行(sub-lists)。
算法步骤:
1 从数列中挑出一个元素,称为 “基准”(pivot)。
2 又一次排序数列,全部元素比基准值小的摆放在基准前面。全部元素比基准值大的摆在基准的后面(相同的数能够到任一边)。在这个分区退出之后,该基准就处于数列的中间位置。
这个称为分区(partition)操作。
3 递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
递归的最底部情形,是数列的大小是零或一,也就是永远都已经被排序好了。虽然一直递归下去,可是这个算法总会退出。由于在每次的迭代(iteration)中。它至少会把一个元素摆到它最后的位置去。
算法二:堆排序算法
堆排序(Heapsort)是指利用堆这样的数据结构所设计的一种排序算法。
堆积是一个近似全然二叉树的结构,并同一时候满足堆积的性质:即子结点的键值或索引总是小于(或者大于)它的父节点。
堆排序的平均时间复杂度为Ο(nlogn) 。
算法步骤:
1. 创建一个堆H[0..n-1]
2. 把堆首(最大值)和堆尾互换
3. 把堆的尺寸缩小1,并调用 shift_down (0),目的是把新的数组顶端数据调整到相应位置
4. 反复步骤2。直到堆的尺寸为1
算法三:归并排序
归并排序(Merge sort。台湾译作:合并排序)是建立在归并操作上的一种有效的排序算法。该算法是採用分治法(Divide and Conquer)的一个很典型的应用。
算法步骤:
1. 申请空间,使其大小为两个已经排序序列之和。该空间用来存放合并后的序列
2. 设定两个指针,最初位置分别为两个已经排序序列的起始位置
3. 比較两个指针所指向的元素,选择相对小的元素放入到合并空间。并移动指针到下一位置
4. 反复步骤 3 直到某一指针达到序列尾
5. 将还有一序列剩下的全部元素直接拷贝到合并序列尾
算法四:二分查找算法
二分查找算法是一种在有序数组中查找某一特定元素的搜索算法。
搜素过程从数组的中间元素開始,假设中间元素正好是要查找的元素,则搜素过程结束;假设某一特定元素大于或者小于中间元素。则在数组大于或小于中间元素的那一半中查找,并且跟開始一样从中间元素開始比較。
假设在某一步骤数组为空,则代表找不到。这样的搜索算法每一次比較都使搜索范围缩小一半。折半搜索每次把搜索区域降低一半。时间复杂度为Ο(logn) 。
算法五:BFPRT(线性查找算法)
BFPRT 算法解决的问题十分经典,即从某n个元素的序列中选出第k大(第k小)的元素。通过巧妙的分析,BFPRT 能够保证在最坏情况下仍为线性时间复杂度。该算法的思想与高速排序思想类似,当然,为使得算法在最坏情况下,依旧能达到o(n)的时间复杂度,五位算法作者做了精妙的处理。
算法步骤:
1. 将n个元素每 5 个一组,分成n/5(上界)组。
2. 取出每一组的中位数,随意排序方法,比方插入排序。
3. 递归的调用 selection 算法查找上一步中全部中位数的中位数。设为x,偶数个中位数的情况下设定为选取中间小的一个。
4. 用x来切割数组,设小于等于x的个数为k,大于x的个数即为n-k。
5. 若i==k,返回x。若i<k,在小于x的元素中递归查找第i小的元素。若i>k。在大于x的元素中递归查找第i-k 小的元素。
终止条件:n=1 时。返回的即是i小元素。
算法六:DFS(深度优先搜索)
深度优先搜索算法(Depth-First-Search),是搜索算法的一种。它沿着树的深度遍历树的节点,尽可能深的搜索树的分支。当节点v的全部边都己被探寻过。搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的全部节点为止。
假设还存在未被发现的节点,则选择当中一个作为源节点并反复以上过程,整个进程反复进行直到全部节点都被訪问为止。
DFS 属于盲目搜索。
深度优先搜索是图论中的经典算法,利用深度优先搜索算法能够产生目标图的相应拓扑排序表,利用拓扑排序表能够方便的解决很多相关的图论问题。如最大路径问题等等。一般用堆数据结构来辅助实现 DFS 算法。
深度优先遍历图算法步骤:
1. 訪问顶点v;
2. 依次从v的未被訪问的邻接点出发。对图进行深度优先遍历;直至图中和v有路径相通的顶点都被訪问。
3. 若此时图中尚有顶点未被訪问。则从一个未被訪问的顶点出发,又一次进行深度优先遍历,直到图中全部顶点均被訪问过为止。
上述描写叙述可能比較抽象,举个实例:
DFS 在訪问图中某一起始顶点 v 后,由 v 出发。訪问它的任一邻接顶点 w1。再从 w1 出发。訪问与 w1 邻 接但还没有訪问过的顶点 w2;然后再从 w2 出发,进行类似的訪问,… 如此进行下去,直至到达全部的邻接顶点都被訪问过的顶点 u 为止。
接着,退回一步,退到前一次刚訪问过的顶点,看是否还有其它没有被訪问的邻接顶点。假设有,则訪问此顶点。之后再从此顶点出发。进行与前述类似的訪问;假设没有。就再退回一步进行搜索。反复上述过程,直到连通图中全部顶点都被訪问过为止。
算法七:BFS (广度优先搜索)
广度优先搜索算法(Breadth-First-Search),是一种图形搜索算法。简单的说。BFS 是从根节点開始,沿着树(图)的宽度遍历树(图)的节点。假设全部节点均被訪问,则算法中止。BFS 相同属于盲目搜索。一般用队列数据结构来辅助实现 BFS 算法。
算法步骤:
1. 首先将根节点放入队列中。
2. 从队列中取出第一个节点。并检验它是否为目标。
假设找到目标。则结束搜寻并回传结果。
否则将它全部尚未检验过的直接子节点增加队列中。
3. 若队列为空,表示整张图都检查过了——亦即图中没有欲搜寻的目标。结束搜寻并回传“找不到目标”。
4. 反复步骤2。
算法八:Dijkstra算法
戴克斯特拉算法(Dijkstra’s algorithm)是由荷兰计算机科学家艾兹赫尔·戴克斯特拉提出。迪科斯彻算法使用了广度优先搜索解决非负权有向图的单源最短路径问题,算法终于得到一个最短路径树。该算法经常使用于路由算法或者作为其它图算法的一个子模块。
该算法的输入包括了一个有权重的有向图 G,以及G中的一个来源顶点 S。
我们以 V 表示 G 中全部顶点的集合。每个图中的边,都是两个顶点所形成的有序元素对。
(u, v) 表示从顶点 u 到 v 有路径相连。我们以 E 表示G中全部边的集合。而边的权重则由权重函数 w: E → [0, ∞] 定义。因此,w(u, v) 就是从顶点 u 到顶点 v 的非负权重(weight)。边的权重能够想像成两个顶点之间的距离。
任两点间路径的权重,就是该路径上全部边的权重总和。
已知有 V 中有顶点 s 及 t,Dijkstra 算法能够找到 s 到 t的最低权重路径(比如,最短路径)。这个算法也能够在一个图中,找到从一个顶点 s 到不论什么其它顶点的最短路径。对于不含负权的有向图。Dijkstra 算法是眼下已知的最快的单源最短路径算法。
算法步骤:
1. 初始时令 S={V0},T={其余顶点},T中顶点相应的距离值
若存在<V0,Vi>,d(V0,Vi)为<V0,Vi>弧上的权值
若不存在<V0,Vi>。d(V0,Vi)为∞
2. 从T中选取一个其距离值为最小的顶点W且不在S中,增加S
3. 对其余T中顶点的距离值进行改动:若加进W作中间顶点,从 V0 到 Vi 的距离值缩短。则改动此距离值
反复上述步骤2、3,直到S中包括全部顶点,即W=Vi 为止
算法九:动态规划算法
动态规划(Dynamic programming)是一种在数学、计算机科学和经济学中使用的。通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。
动态规划经常适用于有重叠子问题和最优子结构性质的问题,动态规划方法所耗时间往往远少于朴素解法。
动态规划背后的基本思想很easy。大致上。若要解一个给定问题,我们须要解其不同部分(即子问题),再合并子问题的解以得出原问题的解。 通常很多子问题很类似。为此动态规划法试图仅仅解决每个子问题一次,从而降低计算量: 一旦某个给定子问题的解已经算出,则将其记忆化存储。以便下次须要同一个子问题解之时直接查表。 这样的做法在反复子问题的数目关于输入的规模呈指数增长时特别实用。
关于动态规划最经典的问题当属背包问题。
算法步骤:
1. 最优子结构性质。假设问题的最优解所包括的子问题的解也是最优的。我们就称该问题具有最优子结构性质(即满足最优化原理)。最优子结构性质为动态规划算法解决这个问题提供了重要线索。
2. 子问题重叠性质。子问题重叠性质是指在用递归算法自顶向下对问题进行求解时。每次产生的子问题并不总是新问题,有些子问题会被反复计算多次。
动态规划算法正是利用了这样的子问题的重叠性质,对每个子问题仅仅计算一次,然后将其计算结果保存在一个表格中,当再次须要计算已经计算过的子问题时,仅仅是在表格中简单地查看一下结果,从而获得较高的效率。
算法十:朴素贝叶斯分类算法
朴素贝叶斯分类算法是一种基于贝叶斯定理的简单概率分类算法。贝叶斯分类的基础是概率推理,就是在各种条件的存在不确定,仅知其出现概率的情况下,怎样完毕推理和决策任务。
概率推理是与确定性推理相相应的。而朴素贝叶斯分类器是基于独立假设的,即假设样本每个特征与其它特征都不相关。
朴素贝叶斯分类器依靠精确的自然概率模型,在有监督学习的样本集中能获取得很好的分类效果。在很多实际应用中,朴素贝叶斯模型參数预计使用最大似然预计方法。换言之朴素贝叶斯模型能工作并没实用到贝叶斯概率或者不论什么贝叶斯模型。
虽然是带着这些朴素思想和过于简单化的假设,但朴素贝叶斯分类器在很多复杂的现实情形中仍能够取得相当好的效果。