Fork me on GitHub

《数据结构与算法之美》——冒泡排序、插入排序、选择排序

排序,是每一本数据结构的书都绕不开的重要部分。

排序的算法也是琳琅满目、五花八门。

每一个算法的背后都是智慧的结晶,思想精华的沉淀。

个人觉得排序算法没有绝对的孰优孰劣,用对了场景,就是最有的排序算法。

当然,撇开这些业务场景,排序算法本身有一些自己的衡量指标,比如我们经常提到的复杂度分析。

我们如何分析一个算法?

排序算法的执行效率

1、最好、最坏和平均情况的时间复杂度

2、时间复杂度的系数、常数和低阶

一般来说,在数据规模n很大的时候,可以忽略这些,但是如果我们需要排序的数据规模在几百、几千,那么这些指标就变的更加重要。

3、比较的次数和移动的次数

排序的过程涉及数据的比较和交换(移动)

排序算法的内存消耗

除了时间复杂度,我们还有空间复杂度,用来衡量内存消耗。这里我们引入原地排序的概念。原地排序即特指空间复杂度为O(1)的排序算法。

排序算法的稳定性

什么是稳定性,这比较抽象。

举个例子,现在有一组集合1,3,5,3,7

按照从小打到的顺序进行排序,结果应该是1,3,3,5,7

稳定指的是原集合的第二个3仍然在第四个3前面。不稳定则情况相反。

冒泡排序

原理

相邻元素两两比较,如果满足大小关系就保持不动,如果不满足,则两两交换位置,以此类推,直到集合有序为止。

之所以叫冒泡排序,因为其过程就犹如水中的气泡,泡泡越大的就在上面,越小的就在下面。

举例

现在给定一个集合4,5,6,3,2,1

第一次冒泡过程如下所示

可以看出在这趟冒泡中,最大的泡泡6已经到达最高的位置,要让集合中所有元素都有序,还要继续冒泡,如下图:

代码


package com.jackie.algo.geek.time.chapter11_sort;

/**
 * @Author: Jackie
 * @date 2019/1/12
 */
public class BubbleSort {
    public static void main(String[] args) {
        int[] arr = new int[]{100,82,74,62,54,147};
        bubbleSort(arr);
        bubbleSort2(arr);
    }
    /**
     * 外层i的循环代表比较的趟数,内层j的循环代表的元素位置
     *  a[0],a[1],a[2],a[3],a[4],a[5]
     *  第一趟走完,最大的元素冒泡到最后a[5]的位置,需要比较的位置即为:
     *  a[0],a[1],a[2],a[3],a[4]
     *  所以可以看到j的终止条件是动态变化的,与i的位置相关,趟数每增加一次,终止的位置就往前挪一个,因为每次都能固定一个元素
     *
     *  注意这里的边界条件,是<还是<=
     *  第一层是小于,因为是从0开始,对于上面的例子来说,是比较length-1=6-1=5趟,因为总共6个元素,只要5趟就能比较完成
     *  好比有两个元素,只要一趟就能比较完成
     *  第二层是同样的道理,假设在i=0时,length-i-1=6-0-1=5,
     *  但是这里<,所以只会到j=4,乍一看你会觉得之比较到了a[j]=a[4],最后a[5]是不是就丢了
     *  其实不是,仔细看下面的比较条件就会发现有a[j+1]即a[5]
     *  所以,综上内层和外层都是从0开始,且都是<而不是<=
     */
    public static void bubbleSort(int[] arr) {
        int length = arr.length;
        if (length <= 0) {
            return;
        }
        int temp;
        for (int i = 0; i < length - 1; i++) {
            boolean flag = false;
            for (int j = 0; j < length - i - 1; j++) {
                if (arr[j] > arr[j+1]) {
                    temp = arr[j];
                    arr[j] = arr[j+1];
                    arr[j+1] = temp;

                    flag = true;
                }
            }
            if (!flag) {
                System.out.println("total loop: " + (i+1) + " times, stop at index:" + i);
                break;
            }
        }
        for (int i = 0; i < length; i++) {
            System.out.print(arr[i] + " ");
        }
        System.out.println();
    }
    /**
     * 和上面的不同之处在于,上面的是保证数组从后往前有序,这里的是保证从前往后的有序
     * 上面的做法如下所示,每次要遍历的元素如下
     * a[0],a[1],a[2],a[3],a[4],a[5]
     * a[0],a[1],a[2],a[3],a[4]     (这里不再遍历a[5]的位置,因为a[5]在第一轮遍历已是最大,不需要参与遍历,下面遍历同理)
     * a[0],a[1],a[2],a[3]
     * a[0],a[1],a[2]
     * a[0],a[1]
     * a[0]
     *
     * 下面的做法如下所示,每次要遍历的元素如下
     * a[0],a[1],a[2],a[3],a[4],a[5]
     *      a[1],a[2],a[3],a[4],a[5]   (这里不再遍历a[0]的位置,因为a[0]在第一轮遍历已是最小,不需要参与遍历,下面遍历同理)
     *           a[2],a[3],a[4],a[5]
     *                a[3],a[4],a[5]
     *                     a[4],a[5]
     *                          a[5]
     */
    public static void bubbleSort2(int[] arr) {
        int length = arr.length;
        if (length <= 0) {
            return;
        }
        int temp;
        for (int i = 0; i < length - 1; i++) {
            boolean flag = false;
            for (int j = length - 1; j > i; j--) {
                if (arr[j] < arr[j-1]) {
                    temp = arr[j];
                    arr[j] = arr[j-1];
                    arr[j-1] = temp;

                    flag = true;
                }
            }
            if (!flag) {
                System.out.println("total loop: " + (length - i - 1) + " times, stop at index:" + i);
                break;
            }
        }
        for (int i = 0; i < length; i++) {
            System.out.print(arr[i] + " ");
        }
        System.out.println();
    }
}

写这类算法对于边界判定、起始条件和结束条件要非常谨慎,比如是用<还是用<=;是从0开始还是从1开始;是到length结束还是到length-1结束。

看似惺忪平常,有时候弄错一个符号就无法得到正确的排序结果。

冒泡排序的这些注意事项已经写在代码的注释中,参见如上代码。

同时,代码已经上传至Github

各项指标

1、是否是原地排序

是,因为冒泡排序只涉及两两元素交换,空间复杂度为O(1)

2、是否是稳定排序

是,对于元素相等的情况,不会交换顺序

3、时间复杂度

平均时间复杂度是O(n2), 这里是n的平方

插入排序

原理

对于给定集合,从左至右,依次保证当前元素的左边集合有序。然后依次顺延当前位置,直至遍历完所有集合元素,保证整个集合有序。

有点抽象,没有关系,看举例。

举例

借用文章https://www.cnblogs.com/bjh1117/p/8335628.html中的例子说明插入排序的过程。


待比较数据:7, 6, 9, 8, 5,1



  第一轮:指针指向第二个元素6,假设6左面的元素为有序的,将6抽离出来,形成7,_,9,8,5,1,从7开始,6和7比较,发现7>6。将7右移,形成_,7,9,8,5,1,6插入到7前面的空位,结果:6,7,9,8,5,1



  第二轮:指针指向第三个元素9,此时其左面的元素6,7为有序的,将9抽离出来,形成6,7,_,8,5,1,从7开始,依次与9比较,发现9左侧的元素都比9小,于是无需移动,把9放到空位中,结果仍为:6,7,9,8,5,1



  第三轮:指针指向第四个元素8,此时其左面的元素6,7,9为有序的,将8抽离出来,形成6,7,9,_,5,1,从9开始,依次与8比较,发现8<9,将9向后移,形成6,7,_,9,5,1,8插入到空位中,结果为:6,7,8,9,5,1



  第四轮:指针指向第五个元素5,此时其左面的元素6,7,8,9为有序的,将5抽离出来,形成6,7,8,9,_,1,从9开始依次与5比较,发现5比其左侧所有元素都小,5左侧元素全部向右移动,形成_,6,7,8,9,1,将5放入空位,结果5,6,7,8,9,1。



  第五轮:同上,1被移到最左面,最后结果:1,5,6,7,8,9。

代码


package com.jackie.algo.geek.time.chapter11_sort;

/**
 * @Author: Jackie
 * @date 2019/1/13
 */
public class InsertSort {
    public static void main(String[] args) {
        int[] arr = new int[]{100,82,74,62,54,147};
        insertSort(arr);
    }
    /**
     * 借用https://www.cnblogs.com/bjh1117/p/8335628.html文中的举例,我们可以看到一个完整的插入排序的过程
     * 通过这个过程,我们可以更好的理解插入排序的思想
     * 待比较数据:7, 6, 9, 8, 5,1
     *
     *   第一轮:指针指向第二个元素6,假设6左面的元素为有序的,将6抽离出来,形成7,_,9,8,5,1,从7开始,6和7比较,发现7>6。将7右移,形成_,7,9,8,5,1,6插入到7前面的空位,结果:6,7,9,8,5,1
     *
     *   第二轮:指针指向第三个元素9,此时其左面的元素6,7为有序的,将9抽离出来,形成6,7,_,8,5,1,从7开始,依次与9比较,发现9左侧的元素都比9小,于是无需移动,把9放到空位中,结果仍为:6,7,9,8,5,1
     *
     *   第三轮:指针指向第四个元素8,此时其左面的元素6,7,9为有序的,将8抽离出来,形成6,7,9,_,5,1,从9开始,依次与8比较,发现8<9,将9向后移,形成6,7,_,9,5,1,8插入到空位中,结果为:6,7,8,9,5,1
     *
     *   第四轮:指针指向第五个元素5,此时其左面的元素6,7,8,9为有序的,将5抽离出来,形成6,7,8,9,_,1,从9开始依次与5比较,发现5比其左侧所有元素都小,5左侧元素全部向右移动,形成_,6,7,8,9,1,将5放入空位,结果5,6,7,8,9,1。
     *
     *   第五轮:同上,1被移到最左面,最后结果:1,5,6,7,8,9。
     *
     * 所以插入排序是保证一个元素的左边所有元素都是有序的,然后逐渐右移,直到遍历完所有的元素来保证整个数据是有序的
     * 下面i从1开始,是表示以a[1]作为哨兵,第一次比较是a[0]和其比较,这里的j的其实位置都是小于i一个位移,即j=i-1
     * 然后依次从右向左挨个比较,如果发现哨兵值小于左侧有序集合,则一直位移,以此保证始终留有一个位置用于插入待排序的值
     * 一旦发现哨兵值如果大于等于(保证稳定性,即不会跑到等于某个值的左侧)左侧集合中的某个值,
     * 则跳出内层循环,仔细想想左侧集合是有序的就明白了
     * 至于最后为什么是a[j+1]=value,直觉上更应该是a[j]=value,但是记得,在跳出内层循环的时候进行了一次j--操作,
     * 所以需要把这个操作补偿进来,变成了j+1
     */
    public static void insertSort(int arr[]) {
        int length = arr.length;
        if (length <= 0) {
            return;
        }
        for (int i = 1; i < length; i++) {
            int value = arr[i];
            int j = i - 1;

            for (; j >= 0; j--) {
                if (arr[j] > value) {
                    arr[j+1] = arr[j];  // 位移
                } else {
                    break;
                }
            }
            arr[j+1] = value;
        }
        for (int i = 0; i < length; i++) {
            System.out.print(arr[i] + " ");
        }
        System.out.println();
    }
}

同冒泡排序,有关边界判定、起始条件和结束条件也都写在注释中,不再赘述。

各项指标

1、是否是原地排序

是,同冒泡排序,空间复杂度为O(1)

2、是否是稳定排序

是,对于元素相等的情况,不会交换顺序

3、时间复杂度

平均时间复杂度是O(n2), 这里是n的平方

选择排序

原理

选择排序思想和插入排序思想比较接近。每次排序从未排序的集合中找到最小的元素放进有序集合,通过这样的遍历排序保证整个集合有序。

举例

代码


package com.jackie.algo.geek.time.chapter11_sort;

/**
 * @Author: Jackie
 * @date 2019/1/13
 */
public class SelectionSort {
    public static void main(String[] args) {
        int[] arr = new int[]{100,82,74,62,54,147};
        selectionSort(arr);
    }
    public static void selectionSort(int[] arr) {
        int length = arr.length;
        if (length <= 1) return;

        for (int i = 0; i < length - 1; ++i) {
            // 查找最小值
            int minIndex = i;
            for (int j = i + 1; j < length; ++j) {
                if (arr[j] < arr[minIndex]) {
                    minIndex = j;
                }
            }
            // 交换
            int tmp = arr[i];
            arr[i] = arr[minIndex];
            arr[minIndex] = tmp;
        }
        for (int i = 0; i < length; i++) {
            System.out.print(arr[i] + " ");
        }
    }
}

各项指标

1、是否是原地排序

是,同冒泡排序,空间复杂度为O(1)

2、是否是稳定排序

否,通过元素的交换可能改变原来的稳定结构,比如5,8,5,2,9,第一次排序后,5和2交换,则第一个5就跑到第二个5后面了,破坏了稳定结构。

3、时间复杂度

平均时间复杂度是O(n2), 这里是n的平方,且最好最坏都是O(n2)。

声明:

文中图片来自极客时间王争老师专题《数据结构与算法之美》

posted @ 2019-01-13 21:35  JackieZheng  阅读(820)  评论(2编辑  收藏  举报