排序算法

排序算法简介

1. 冒泡排序

2. 选择排序

3. 插入排序

4. 希尔排序

5. 快速排序

6. 归并排序

排序算法简介

排序算法（英语：Sorting algorithm）是一种能将一串数据依照特定顺序进行排列的一种算法。

排序算法的稳定性

稳定性：稳定排序算法会让原本有相等键值的纪录维持其相对次序。也就是如果一个排序算法是稳定的，当有两个相等键值的纪录 R 和 S，且在原本的列表中 R 出现在 S 之前，在排序过的列表中 R 也将会是在 S 之前。

当相等的元素是无法分辨的，比如像是整数，稳定性并不是一个问题。然而，假设以下的数对将要以他们的第一个数字来排序。

(4, 1) (3, 1) (3, 7) (5, 6)

在这个状况下，有可能产生两种不同的结果，一个是让相等键值的纪录维持相对的次序，而另外一个则没有：

(3, 1) (3, 7) (4, 1) (5, 6)  （维持次序）
(3, 7) (3, 1) (4, 1) (5, 6)  （次序被改变）

不稳定排序算法可能会在相等的键值中改变纪录的相对次序，但是稳定排序算法从来不会如此。

不稳定排序算法可以被特别地实现为稳定，做这件事情的一个方式是人工扩充键值的比较，如此在其他方面相同键值的两个对象间之比较（比如上面的比较中加入第二个标准：第二个键值的大小），就会被决定使用在原先数据次序中的条目，当作一个同分决赛。然而，要记住这种次序通常牵涉到额外的空间负担。

常见算法效率比较

性能从优到劣：

1. 冒泡排序

介绍

冒泡排序（英语：Bubble Sort）是一种简单的排序算法，它通过不断地交换“大数”的位置达到排序的目的。因为不断出现“大数”类似于水泡不断出现，因此被形象地称为冒泡排序算法。

它重复地遍历要排序的数列，一次比较两个元素，如果他们的大小顺序有误则把它们交换过来。遍历数列的工作是重复地进行直到没有元素再需要交换，也就是说该数列已经排序完成。

冒泡排序算法的运作如下：

比较相邻的元素。如果第一个比第二个大（升序），就交换他们两个。
对每一对相邻元素作同样的工作，从开始第一对到结尾的最后一对。这步做完后，最后的元素会是最大的数。
针对所有的元素重复以上的步骤，除了最后一个。
持续每次对越来越少的元素重复上面的步骤，直到没有任何一对元素需要比较。

时间复杂度

最优时间复杂度：O(n)（表示第一次遍历发现没有任何可以交换的元素，则排序结束）
最坏时间复杂度：O(n²)
稳定性：稳定

交换过程图示（第一次遍历）

那么我们需要进行n-1次冒泡过程，每次对应的比较次数如下图所示：

代码实现

Python 版：

 1 def bubble_sort(alist):
 2     "冒泡排序"
 3     n = len(alist)
 4     for j in range(n-1):  # 控制轮数（图示中的Pass）
 5         count = 0  # 记录每轮中的比较次数
 6         for i in range(n-1-j):  # 每轮遍历中的元素比较次数，逐渐减少（图示中的Comparisons）；也可以使用 for i in range(n-1, 0, -1); for j in range(i):
 7             if alist[i] > alist[i+1]:
 8                 alist[i], alist[i+1] = alist[i+1], alist[i]
 9                 count += 1
10         # 优化时间复杂度，若该轮没有交换元素，即代表列表已是有序，则无需再进行下一轮比较
11         # 即可直接退出
12         if count == 0:
13             return
14 
15                 
16 # j: 0     i: range(n-1-0) = n-1
17 # j: 1     i: range(n-1-1) = n-2
18 # j: 2     i: range(n-1-2) = n-3
19 # ...
20 # j: n-2   i: range(n-1-(n-2)) = 1
21 
22 
23 if __name__ == "__main__":
24     li = [1, 21, 4, 2, 56, 2, 34, 67]
25     bubble_sort(li)
26     print(li)  # [1, 2, 2, 4, 21, 34, 56, 67]

Java 版：

 1     public static void main(String[] args) {
 2         int[] input = {12, 34, 65, 23, 54, 12, 34, 54};
 3         bubbleSort(input);
 4         System.out.println(Arrays.toString(input));
 5     }
 6 
 7     public static void bubbleSort(int[] arr) {
 8         int length = arr.length;
 9         for (int i=0; i<length-1; i++) {
10             int changeCount = 0;
11             for (int j=0; j<(length-1-i); j++) {
12                 if (arr[j]>arr[j+1]) {
13                     int temp = arr[j];
14                     arr[j] = arr[j+1];
15                     arr[j+1] = temp;
16                     changeCount ++;
17                 }
18             }
19             if (changeCount==0) {
20                 return;
21             }
22         }
23     }

2. 选择排序

选择排序（Selection sort）的算法算是枚举法的应用，就是反复从未排序的数列中取出最小（大）的元素，加入到另一个数列中，最后的结果即为已排序的数列。它的具体工作原理如下：

在未排序序列中找到最小（大）元素，存放到排序序列的起始位置。
从剩余未排序元素中继续寻找最小（大）元素，然后放到已排序序列的末尾。
以此类推，直到所有元素均排序完毕。

选择排序的主要优点与数据移动有关。如果某个元素位于正确的最终位置上，则它不会被移动。选择排序每次交换一对元素，它们当中至少有一个将被移到其最终位置上，因此对 n 个元素的数列进行排序总共进行至多 n-1 次交换。在所有的完全依靠交换去移动元素的排序方法中，选择排序属于非常好的一种。

时间复杂度

最优时间复杂度：O(n²)
最坏时间复杂度：O(n²)
稳定性：不稳定（考虑升序每次选择最大的情况）

Python版的选择排序：

理论上选择排序的时间复杂度为 O(n²)，但在 Python 中较为特殊，因为在 Python 列表中寻找最小的那个数不需要逐个比较，使用 min() 就可以一步到位地得到最小的数，所以使用 Python 版的选择排序，时间复杂度是 O(n)。因此理论上 Python 版本的排序算法中选择排序算法是最快的。

排序过程图示

代码实现：

Python 常规版

 1 def selected_sort(alist):
 2     n = len(alist)
 3     # 需要进行n-1次选择操作
 4     for i in range(n-1):
 5         # 记录最小位置
 6         min_index = i
 7         # 从i+1位置到末尾，选择出最小的元素
 8         for j in range(i+1, n):
 9             if alist[j] < alist[min_index]:
10                 min_index = j
11         # 如果选择出的元素不在正确位置，进行交换
12         if min_index != i:
13             alist[i], alist[min_index] = alist[min_index], alist[i]
14 
15 
16 alist = [54, 226, 93, 17, 77, 31, 44, 55, 20]
17 selected_sort(alist)
18 print(alist)

python 内置的 min()：

 1 import random
 2 import timeit
 3 
 4 def random_list(n):
 5     return [random.randint(0, 100) for i in range(n)]
 6 
 7 def selection_sort(i_list):
 8     if len(i_list) <= 1:
 9         return i_list
10     # 一个长度为n的数列需要排序n-1轮
11     for i in range(0, len(i_list)-1):
12         if i_list[i] != min(i_list[i:]):
13             # 使用min()找到列表剩余元素中的最小值
14             min_index = i_list.index(min(i_list[i:]), i)
15             i_list[i], i_list[min_index] = i_list[min_index], i_list[i]
16         # print("第%s轮的排序结果：%s" % (i+1, i_list))
17     return i_list
18 
19 if __name__ == "__main__":
20     i_list = random_list(20)
21     print(i_list)
22     print(selection_sort(i_list))
23     print(timeit.timeit("selection_sort(i_list)", "from __main__ import selection_sort, i_list", number=100))

Java 版：

 1     public static void main(String[] args) {
 2         int[] input = {12, 34, 65, 23, 54, 12, 34, 54};
 3         selectSort(input);
 4         System.out.println(Arrays.toString(input));
 5     }
 6 
 7     public static void selectSort(int[] arr) {
 8         int length = arr.length;
 9         for (int i=0; i<length-1; i++) {
10             int tmpMin = arr[i];
11             for (int j=i+1; j<length; j++) {
12                 if (arr[j]<tmpMin) {
13                     tmpMin = arr[j];
14                     arr[j] = arr[i];
15                     arr[i] = tmpMin;
16                 }
17             }
18         }
19     }

3. 插入排序

插入排序（Insertion Sort）可能是最好理解的排序了。插入排序方法与打扑克取牌的排序很相似，在打扑克时，每取一张新牌，都会与手上已有的牌进行比较，将新牌插入到比自己小的牌后面。等取完所有的牌后，手上已有的牌就是各有序的序列。

它的工作原理是通过构建有序序列，对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。插入排序在实现上，在从后向前扫描过程中，需要反复把已排序元素逐步向后挪位，为最新元素提供插入空间。

当原始序列的元素大部分已排好序的情况下，插入排序会非常有效率，因为它不需要执行太多的数据搬移操作。

时间复杂度

最优时间复杂度：O(n)（升序排序时，序列已经处于升序状态）
最坏时间复杂度：O(n²)
稳定性：稳定

排序过程图示

演示效果

代码实现

Python 版：

 1 def insertion_sort(data):
 2     for i in range(1, len(data)):
 3         tmp = data[i]  # 暂存数据
 4         count = i
 5         while i >= 1 and tmp < data[i-1]:  # 遍历与前一个元素比较
 6             data[i] = data[i-1]  # 把所有元素往后移一位
 7             i -= 1
 8         data[i] = tmp  # 若当前元素大于等于前一个元素，则当前位置放入暂存数据
 9         print("第%d次排序结果：%s" % (count, data))
10     return data
11 
12 
13 data = [12, 11, 23, 4, 1, 5, 12, 31, 4]
14 insertion_sort(data)

执行结果：

第1次排序结果：[11, 12, 23, 4, 1, 5, 12, 31, 4]
第2次排序结果：[11, 12, 23, 4, 1, 5, 12, 31, 4]
第3次排序结果：[4, 11, 12, 23, 1, 5, 12, 31, 4]
第4次排序结果：[1, 4, 11, 12, 23, 5, 12, 31, 4]
第5次排序结果：[1, 4, 5, 11, 12, 23, 12, 31, 4]
第6次排序结果：[1, 4, 5, 11, 12, 12, 23, 31, 4]
第7次排序结果：[1, 4, 5, 11, 12, 12, 23, 31, 4]
第8次排序结果：[1, 4, 4, 5, 11, 12, 12, 23, 31]

Java 版：

 1     public static void main(String[] args) {
 2         int[] input = {12, 34, 65, 23, 54, 12, 34, 54, 17};
 3         insertSort(input);
 4         System.out.println(Arrays.toString(input));
 5     }
 6 
 7     public static void insertSort(int[] arr) {
 8         for (int i=1; i<arr.length; i++) {
 9             int tmp = arr[i];
10             for (int j=i; j>0; j--) {
11                 if (tmp<arr[j-1]) {
12                     arr[j]=arr[j-1];
13                 } else {
14                     arr[j] = tmp;
15                     break;
16                 }
17             }
18         }
19     }

4. 希尔排序

希尔排序（Shell Sort）是插入排序算法的一种更高效的改进版本。该方法因 DL.Shell 于 1959 年提出而得名。

希尔排序的基本思想是：将数组列在一个表中，并对每一列进行插入排序，重复这过程，不过每次用更长的列（步长更长了，列数更少了）来进行，最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法，算法本身还是使用数组进行排序。

时间复杂度

最优时间复杂度：根据步长序列的不同而不同
最坏时间复杂度：O(n²)
稳定性：不稳定

希尔排序过程

例如，假设有这样一组数 [13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10]，如果我们以步长为 5 开始进行排序，我们可以通过将这列表放在有 5 列的表中来更好地描述算法，这样他们就应该看起来是这样（竖着的元素是步长组成）：

13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10

然后我们对每列进行排序：

10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45

将上述四行数字，依序接在一起时我们得到：[10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45]。这时 10 已经移至正确位置了，然后再以 3 为步长进行排序：

排序之后变为：

最后以 1 步长进行排序（此时就是简单的插入排序了）。

示例分析

代码实现

 1 # 希尔排序
 2 def shell_sort(alist):
 3     count = 1  # 打印排序次数
 4     n = len(alist)
 5     gap = n // 2  # 步长需通过数学计算，质数最好。为了算法方便，习惯选2
 6     # gap变化到0前，子序列插入算法执行的次数
 7     while gap > 0:
 8         # 子序列的插入算法，与普通插入算法区别在于gap步长
 9         for i in range(gap, n):
10             tmp = alist[i]
11             while i >= gap and tmp < alist[i-gap]:  # 每组子序列中，当前元素与前gap个元素比较
12                 alist[i] = alist[i-gap]
13                 i -= gap
14             alist[i] = tmp
15         print("gap=%d, 第%d次排序的结果：%s" % (gap, count, alist))
16         # 每轮排序对半缩短gap
17         gap //= 2
18         count += 1
19 
20 
21 alist = [63, 92, 27, 36, 45, 71, 58, 7]
22 shell_sort(alist)

执行结果：

gap=4, 第1次排序的结果：[45, 71, 27, 7, 63, 92, 58, 36]
gap=2, 第2次排序的结果：[27, 7, 45, 36, 58, 71, 63, 92]
gap=1, 第3次排序的结果：[7, 27, 36, 45, 58, 63, 71, 92]

5. 快速排序

快速排序（英语：Quicksort），又称划分交换排序（partition-exchange sort），是目前公认最佳的排序法。它通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据都要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。

步骤为：

从数列中挑出一个元素，称为“基准”(pivot)。
重新排序数列，所有元素比基准值小的摆放在基准前面，所有元素比基准值大的摆在基准的后面（相同的数可以到任一边）。在这个分区结束之后，该基准就处于数列的中间位置。这个称为分区（partition）操作。
递归地（recursive）把小于基准值元素的子数列和大于基准值元素的子数列排序。

递归的最底部情形，是数列的大小是零或一，也就是永远都已经被排序好了。虽然一直递归下去，但是这个算法总会结束，因为在每次的迭代（iteration）中，它至少会把一个元素摆到它最后的位置去。

时间复杂度

最优时间复杂度：O(nlogn)
最坏时间复杂度：O(n²)
稳定性：不稳定

排序过程图示

代码实现

Python 版：

 1 def quick_sort(alist, start, end):
 2     # 递归的退出条件
 3     if start >= end:
 4         return
 5     # 设定起始元素为要寻找位置的基准元素
 6     mid_value = alist[start]
 7     # low为从左往右的游标
 8     low = start
 9     # high为从右往左的游标
10     high = end
11     # 当low与high未重合
12     while low < high:
13         # 当low与high未重合时，若high指向的元素不比基准元素小，则high向左移动一位
14         while low < high and alist[high] >= mid_value:
15             high -= 1
16         # 若high指向的元素比基准元素小，则退出循环，交换元素位置
17         alist[low] = alist[high]
18         # 当low与high未重合时，若low指向的元素比基准元素小，则low向右移动一位
19         while low < high and alist[low] < mid_value:
20             low += 1
21         # 若low指向的元素比基准元素大，则推出循环，交换元素位置
22         alist[high] = alist[low]
23     # 当low与high重合，退出循环，此时所指位置为基准元素的正确位置
24     # 将基准元素放到该位置
25     alist[low] = mid_value
26     # 对基准元素左边的子序列进行递归快速排序
27     quick_sort(alist, start, low-1)
28     # 对基准元素右边的子序列进行递归快速排序
29     quick_sort(alist, low+1, end)
30 
31 
32 alist = [54, 226, 93, 17, 77, 31, 44, 55, 20]
33 quick_sort(alist, 0, len(alist)-1)
34 print(alist)

Java 版：

 1 import java.util.Arrays;
 2 
 3 public class Demo {
 4 
 5     public static void main(String[] args) {
 6         int[] arr = new int[]{21,13,4,16,7,39,4,10};
 7         quickSort(arr, 0, arr.length-1);
 8         System.out.println(Arrays.toString(arr));  // [4, 4, 7, 10, 13, 16, 21, 39]
 9     }
10 
11     // 快排
12     public static void quickSort(int[] arr, int start, int end) {
13         if (start>=end) {
14             return;
15         }
16         int standard = arr[start];
17         int left = start;
18         int right = end;
19         while (left<right) {
20             while (left < right && arr[right] >= standard) {
21                 right--;
22             }
23             arr[left] = arr[right];
24             while (left < right && arr[left] < standard) {
25                 left++;
26             }
27             arr[right] = arr[left];
28         }
29         arr[left] = standard;
30         quickSort(arr, start, left-1);
31         quickSort(arr, left+1, end);
32     }
33 }

时间复杂度 O(nlogn) 分析：

在最好的情况下，每次运算一次分区，我们会把一个数列分为两个几近相等的片段。这个意思就是每次递归调用处理一半大小的数列。因此，在到达大小为一的数列前，我们只要作 logn 次嵌套的调用，这个意思就是调用树的深度是 O(logn)。
同时，在同一层次结构的左右两个递归调用中，不会处理到原来数列的相同部分。因此，程序调用的每一层次结构总共全部仅需要 O(n) 的时间（每次调用会有某些共同的额外耗费，但是因为在每一层次结构仅仅只有 O(n) 个调用，这些被归纳在 O(n) 系数中）。

6. 归并排序

归并排序是采用分治法的一个非常典型的应用。归并排序的思想就是先递归分解数组，再合并数组。

将数组分解最小之后，然后合并两个有序数组，基本思路是比较两个数组的最前面的数，谁小就先取谁，取了后相应的指针就往后移一位。然后再比较，直至一个数组为空，最后把另一个数组的剩余部分复制过来即可。

时间复杂度

最优时间复杂度：O(nlogn)
最坏时间复杂度：O(nlogn)
稳定性：稳定

归并排序的分析

代码实现：版本一

 1 def merge_sort(alist):
 2     """归并排序"""
 3     n = len(alist)
 4     if n <= 1:
 5         return alist
 6     mid = n // 2
 7     # left 采用归并排序后形成的有序的新的列表
 8     left_li = merge_sort(alist[:mid])
 9     # right 采用归并排序后形成的有序的新的列表
10     right_li = merge_sort(alist[mid:])
11 
12     # 将两个有序的子序列合并为一个新的整体
13     # merge(left, right)
14     left_pointer, right_pointer = 0, 0
15     result = []
16 
17     while left_pointer < len(left_li) and right_pointer < len(right_li):
18         if left_li[left_pointer] <=  right_li[right_pointer]:
19             result.append(left_li[left_pointer])
20             left_pointer += 1
21         else:
22             result.append(right_li[right_pointer])
23             right_pointer += 1
24 
25     result += left_li[left_pointer:]
26     result += right_li[right_pointer:]
27     return result
28 
29 
30 if __name__ == "__main__":
31     li = [54, 26, 93, 17, 77, 31, 44, 55, 20]
32     print(li)
33     sorted_li = merge_sort(li)
34     print(li)
35     print(sorted_li)

版本二

 1 import random
 2 import timeit
 3 
 4 def random_list(n):
 5     return [random.randint(0, 100) for i in range(n)]
 6 
 7 def merge_sort(i_list):
 8     if len(i_list) <= 1:
 9         return i_list
10     mid = len(i_list) // 2
11     left, right = i_list[:mid], i_list[mid:]
12     # 将左右子数列再拆分成左右子子子……数列
13     return merge_list(merge_sort(left), merge_sort(right))
14 
15 # 将左右两个有序数列进行合并
16 def merge_list(left, right):
17     result_list = []
18     while left and right:
19         if left[0] >= right[0]:
20             result_list.append(right.pop(0))
21         else:
22             result_list.append(left.pop(0))
23     result_list.extend(left)
24     result_list.extend(right)
25     return result_list
26 
27 if __name__ == "__main__":
28     i_list = random_list(20)
29     print(i_list)
30     print(merge_sort(i_list))
31     print(timeit.timeit("merge_sort(i_list)", "from __main__ import merge_sort, i_list", number=100))

posted @ 2020-04-08 23:49 Juno3550 阅读(253) 评论(0) 收藏举报

刷新页面返回顶部

排序算法简介

排序算法的稳定性

常见算法效率比较

性能从优到劣：

1. 冒泡排序

介绍

时间复杂度

交换过程图示（第一次遍历）

代码实现

2. 选择排序

时间复杂度

排序过程图示

代码实现：

3. 插入排序

时间复杂度

排序过程图示

演示效果

代码实现

4. 希尔排序

时间复杂度

希尔排序过程

示例分析

代码实现

5. 快速排序

时间复杂度

排序过程图示

代码实现

6. 归并排序

时间复杂度

归并排序的分析

代码实现：版本一

版本二

公告