下面要讲到的8种排序都属于内部排序,既在内存中完成,主要从理论原理方面来分析的。
插入排序
①直接插入排序
例:六个数12 15 9 20 6 31 24 用直接插入排序,如下图:
思路:
第一步:从给出的六个数中,随便拿出一个数,比如12,形成一个有序的数据序列(一个数当然是有序的数据序列了,不看12之外的数,就当其他的数不存在);
第二步:从剩下的五个数中挑出一个数来,比如15,和刚才的12作比较,12<15,因此,放在12后面,形成数据序列12 15;
第三步:从剩下的四个数中挑出一个数来,比如9,和刚才的有序数据序列12 15作比较,9 < 12 < 15,因此,放在最前面,形成数据序列9 12 15;
第N步,经过这样一个一个的插入并对比,就形成了上图所示的排序结果。在一个元素插入时,首先要和数据序列中最大的元素作比较,如果遇到相同的,则放在相同元素的后面。
特性:
因为要不断的插入,因此直接插入排序一般采用链表结构,属于稳定排序。
②希尔(Shell)排序
是直接插入排序的改进,例:十个数57 68 59 52 72 28 96 33 24 19用希尔排序,如下图:
思路:
第一步:用排序数字的总数除以2,取奇数得到步长(增量)d1 = 5;
第二步:根据步长d1,将十个数分成五组,如图所示,对这五组各自进行直接插入排序;
第三步:用步长d2继续除以2,取最近的奇数得到步长d2=3;
第四步:根据步长d2,将十个数分成三组,如图所示,对着五组各自进行直接插入排序;
第N步:重复上述分组和排序操作,直到步长变成1,即所有记录放进一个组中排序为止。
特性
由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。
选择排序
①简单选择排序
例:四个数57 68 59 52选择排序:
思路:
第一步:从四个数找到最小的,和初始状态排在第一位的移动互换;
第二步:从剩下三个数中找到最小的,和初始状态排在第二位的移动互换;
第N步:重复上述查找最小和互换的步骤,直到最后一个为止。
特性
举个例子,序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中两个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。
②堆排序(图片示例均来自quanquanfly)
如果不清楚堆及特性可移步本人上一篇博客《常用数据结构-几种特殊的二叉树》,关于堆排序,有些复杂,下面举例说明:例:对数列{12,56,23,26,15,86,92,75,65}建立大顶堆(大根堆),则初始堆是?
思路:
分为两个大的过程,第一是建堆过程;
思路:
第一步:根据完全二叉树排列给出的数字,如上图中第一个图;
第二步:因为树是一个单向的过程,叶子结点是无法知道父结点的,因此不能拿叶子结点去和父结点比较;根据结点i,i>=n/2为叶子结点的特性,找出最后一个非叶子结点,然后拿它和它的叶子结点作比较,如果比叶子结点小,则互换(建立的是大顶堆),反之不动。
第三步:紧接着调整n/2 - 1号结点(求出n/2 -1 = 3,也就是23号结点),从图中看出23号结点的两个结点都比它大,那么择优选取一个最大的进行互换。
第N步:按照上述方法,依次互换,最后建立了一个大顶堆。
第二是堆排序过程:
思路:
第一步:首先根据上面建立好的初始堆将根结点92输出,然后用编号最大的结点65替代根结点,断开最大编号结点的指针。
第二步:上一步完成后,检查65结点是否符合大顶堆要求,如果不符合又进行一次建堆的过程(参照第一个过程)。
第N步:按照上述两个步骤,反复操作,就会得到需要的结果。
有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法
交换排序
①冒泡排序
比较常见的排序算法。举例说明:
思路:
第一步:将倒数第一个和倒数第二个数进行比较,如果小,则互换;
第二步:将倒数第二个和倒数第三个数进行比较,如果小,则互换;
第N步:筛选出最小的一个数,然后从剩下的数中按照上面的方法反复操作,得到需要的序列。
特性
如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换,所以相同元素的前后顺序并没有改变,所以冒泡排序是一种稳定排序算法。
②快速排序
快速排序(分治思想)是对冒泡排序的一种改进,思想:从数列中挑出一个元素,称为 "基准"(pivot);重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到任一边)。在这个分割结束之后,该基准就处于数列的中间位置。这个称为分割(partition)操作;递归地(recursive)把小于基准值元素的子数列和大于基准值元素的子数列排序。
思路:
第一步:从给出的数列中找到一个基准,如图中的57,左指针指向57,右指针指向最后一个元素;
第二步:对左指针与右指针指向的元素作对比,右指针指向的元素19比左指针指向的元素57小(基准),互换位置;
第三步:左指针右移一个后跟右指针对比,68>57,因此互换;
第N步:按照上述的步骤经过指针的不断移动和元素的对比互换,最后得出第一个以57为中心的序列(左侧小于57,右侧大于57);接下来利用递归分别对57前后的进行排序。
特性
上面右侧的动态图很好的说明了快速排序的思路,快速排序是一个不稳定的排序算法。
归并排序
该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。
思路:
第一步:把待排序的每一个元素看做一个有序表(则由n个有序表),通过两两合并,生成⌊n/2⌋个长度为2(最后一个表的长度可能小于2)的有序表。
第二步:每组内部进行排序;
第三步:两组两组进行归并,将两个指针分别定为两组最小的两个数,然后进行比较,小的挑出来,指针后移,继续比较。
第N步:进过上述不断的归并和比较,最终得出一个正确的序列。
归并排序是稳定的排序算法
基数排序
基数排序其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。
思路:
第一步:将给出的序列元素的个位进行收集,然后按照如图所示,放到对应的位置(0-9序列),并根据个位排出大小,形成了一个序列。
第二步:收集十位,根据第一步产生的序列放到对应的位置,形成一个新的序列;
第三步:收集百位,根据第二步产生的序列放到对应的位置,形成想要的结果序列。
特性
基数排序基于分别排序,分别收集,所以其是稳定的排序算法
各类算法的比较