09 排序（上）：为什么插入排序比冒泡排序更受欢迎？

一、排序方法与复杂度归类

（1）几种最经典、最常用的排序方法：

冒泡排序、插入排序、选择排序、快速排序、归并排序、计数排序、基数排序、桶排序

（2）复杂度归类

O（n^2）：冒泡排序、插入排序、选择排序
O（nlogn）：快速排序、归并排序
O（n）：计数排序、基数排序、桶排序

二、如何分析一个“排序算法”？

（1）算法的执行效率

1.最好、最坏、平均情况时间复杂度
2.时间复杂度的系数、常数和低阶
3.比较次数，交换（或移动）次数

（2）排序算法的稳定性

1.稳定性的概念

如果待排序的序列中存在值相等的元素，经过排序之后，相等元素之间原有的先后顺序不变。

2.稳定性的重要性：可针对对象的多种属性进行有优先级的排列
3.举例
给电商交易系统中的“订单”排序，按照金额大小对订单数据排序；对于相同金额的订单，以下单时间早晚排序。
用稳定排序算法可简洁地解决。
先按照下单时间给订单排序，排序完成后用稳定排序算法按照订单金额重新排序。

（3）排序算法的内存损耗

原地排序算法：特指空间复杂度是 O（1）的排序算法。

三、冒泡排序

冒泡排序只会操作相邻的两个数据。每次冒泡操作都会对相邻的两个元素进行比较，看是否满足大小关系要求，如果不满足就让他俩互换。

稳定性：冒泡排序是稳定的排序算法

空间复杂度：冒泡排序是原地排序算法

时间复杂度：

1.最好情况（满有序度）：O（n）
2.最坏情况（满逆序度）：O（n^2）
3.平均情况：

“有序度”和“逆序度”：对于不完全有序的数组，如4，5，6，3，2，1，有序元素对为3个————（4，5），（4，6），（5，6），有序度为3，逆序度为12；对于一个完全有序的数组，如1，2，3，4，5，6，有序度就是 n*(n-1)/2，也就是15，称作满有序度；逆序度=满有序度-有序度；冒泡排序、插入排序交换（或移动）次数=逆序度。

最好情况下，初始有序度为 n(n-1)/2，最坏情况下初始有序度为0，则平均初始有序度为 n(n-1)/4，即交换次数为 n*(n-1)/4，因交换次数 < 比较次数 < 最坏情况时间复杂度，所以平均时间复杂度为 O(n^2)。

代码实现：

// 冒泡排序，a表示数组，n表示数组大小
public void bubbleSort(int[] a, int n) {
  if (n <= 1) return;
 
 for (int i = 0; i < n; ++i) {
    // 提前退出冒泡循环的标志位
    boolean flag = false;
    for (int j = 0; j < n - i - 1; ++j) {
      if (a[j] > a[j+1]) { // 交换
        int tmp = a[j];
        a[j] = a[j+1];
        a[j+1] = tmp;
        flag = true;  // 表示有数据交换      
      }
    }
    if (!flag) break;  // 没有数据交换，提前退出
  }
}

四、插入排序

插入排序将数组数据分成已排序区间和未排序区间。初始已排序区间只有一个元素，即数组第一个元素。在未排序区间取出一个元素插入到已排序区间的合适位置，直到未排序区间为空。

空间复杂度：插入排序是原地排序算法

时间复杂度

1.最好情况：O（n）
2.最坏情况：O（n^2）
3.平均情况：O（n^2）（往数组中插入一个数的平均时间复杂度是 O（n），一共重复 n 次）

稳定性：插入排序是稳定的排序算法

代码实现：

// 插入排序，a表示数组，n表示数组大小
public void insertionSort(int[] a, int n) {
  if (n <= 1) return;

  for (int i = 1; i < n; ++i) {
    int value = a[i];
    int j = i - 1;
    // 查找插入的位置
    for (; j >= 0; --j) {
      if (a[j] > value) {
        a[j+1] = a[j];  // 数据移动
      } else {
        break;
      }
    }
    a[j+1] = value; // 插入数据
  }
}

五、选择排序

选择排序将数组分成已排序区间和未排序区间。初始已排序区间为空。每次从未排序区间中选出最小的元素插入已排序区间的结尾，直到未排序区间为空。

空间复杂度：选择排序是原地排序算法

时间复杂度：（都是 O（n^2））

1.最好情况：O（n^2）
2.最坏情况：O（n^2）
3.平均情况：O（n^2）

稳定性：选择排序是稳定的排序算法

六、总结

七、思考

选择排序和插入排序的时间复杂度相同，都是O(n^2)，在实际的软件开发中，为什么我们更倾向于使用插入排序而不是冒泡排序呢？

答：从代码实现上来看，冒泡排序的数据交换要比插入排序的数据移动复杂，冒泡排序需要3个赋值操作，而插入排序只需要1个，所以在相同数组进行排序时，冒泡排序的运行时间理论上要长于插入排序。

冒泡排序中数据的交换操作：
if (a[j] > a[j+1]) { // 交换
   int tmp = a[j];
   a[j] = a[j+1];
   a[j+1] = tmp;
   flag = true;
}

插入排序中数据的移动操作：
if (a[j] > value) {
  a[j+1] = a[j];  // 数据移动
} else {
  break;
}

posted @ 2021-07-29 22:35 张晓风阅读(72) 评论(0) 编辑收藏举报

张晓风

09 排序（上）：为什么插入排序比冒泡排序更受欢迎？

一、排序方法与复杂度归类

（1）几种最经典、最常用的排序方法：

（2）复杂度归类

二、如何分析一个“排序算法”？

（1）算法的执行效率

（2）排序算法的稳定性

（3）排序算法的内存损耗

三、冒泡排序

稳定性：冒泡排序是稳定的排序算法

空间复杂度：冒泡排序是原地排序算法

时间复杂度：

代码实现：

四、插入排序

空间复杂度：插入排序是原地排序算法

时间复杂度

稳定性：插入排序是稳定的排序算法

代码实现：

五、选择排序

空间复杂度：选择排序是原地排序算法

时间复杂度：（都是 O（n^2））

稳定性：选择排序是稳定的排序算法

六、总结

七、思考

公告