/*--------------------CSS部分-------------------*/ /*--------------------JS部分-------------------*/

浅谈数据结构-选择排序(简单、堆排序)

选择排序:每趟从待排序的记录中选出关键字最小的记录,顺序放在已排序的记录序列末尾,直到全部排序结束为止。

选择排序正如定义所讲,在数组查询出最小值,然后放在此次循环开始位置(前一次循环已经获取比它更小的值放在前面)。

简单选择排序就是单纯的从数组中一次一次循环获取到最小值,放到循环位置。而堆排序正如名字,是从一个堆中选择,然后放在堆的循环开始位置,所以重点就是如何争取获取堆(分组)。

一、简单选择排序

1、算法思想

正如图上所示,每次选择最小值,然后放在本次循环的开始位置。

2、代码

//选择排序
void SortAlgorithm::SelectSort(pSqlList pList)
{
    int i,j,min;
    printf("开始验证选择排序");
    //选择排序和低级冒泡排序很像,关键就是在比较时,低级冒泡进行数据交换,而选择排序进行记录,最后只交换一次
    for (i =0;i<pList->length;i++)
    {
        min = i;
        for(j = pList->length-1;j>=i;j--)
        {
            //注意数组坐标,千万别溢出
            if (pList->SqlArray[min] > pList->SqlArray[j])
            {
                min = j;
            }
        }
        //最后进行交换,先选择最小的,最后一次交换
        swap(pList,i,min);
        PrintSqlList(pList);
    }


}

简单选择排序算法海华丝比较简单,关键点就是遍历寻找最小记录,然后入循环开始位置进行交换。

二、堆排序

1、堆排序概念

堆排序是首先引入完全二叉树的概念,就是构建完全二叉树,前提是完全二叉树是有特点的,也就是大根堆和小根堆。

上图是完全二叉树,在完全二叉树中有几个性质:

设当前元素在数组中以R[i]表示,那么,
(1) 它的左孩子结点是:R[2*i+1];
(2) 它的右孩子结点是:R[2*i+2];
(3) 它的父结点是:R[(i-1)/2];

(4) R[i] <= R[2*i+1] 且 R[i] <= R[2i+2]。

大根堆:每个结点的关键字都不小于其孩子结点的关键字。

小根堆:每个结点的关键字都不大于其孩子结点的关键字。

2、算法思想

(1)根据初始数组去构造初始堆,默认是大根堆(构建一个完全二叉树,保证所有的父结点都比它的孩子结点数值大)。

(2)每次交换第一个和最后一个元素,输出最后一个元素(最大值),然后把剩下元素重新调整为大根堆。

上述算法是个循环操作,先构建,然后交换输出,最后调整余下的为大根堆,其实就是寻找最大值,其实只需要左右两个结点,那个比较大,就获取那个,所以调整堆排序也是比较简单,就是比较左右结点,获取最大值

第一步:构建大根堆

第二步、输出、调整

3、代码

////堆排序
void SortAlgorithm::HeapSort(pSqlList pList)
{
    //循环构建堆
    for (int i = pList->length/2;i>0;i--)
    {
        AdjustHeap(pList,i,pList->length-1);
    }
    PrintSqlList(pList);
    for (int i = pList->length-1;i>1;i--)
    {
        //循环输出根节点,同时再次调整为大根堆
        swap(pList,1,i);     //根节点位于最前面,也就是1,这样就将1最大值,放在数组后面了
        AdjustHeap(pList,1,i-1);
        PrintSqlList(pList);
    }
}
inline void SortAlgorithm::AdjustHeap(pSqlList pList,int start,int length)
{
    int temp  = pList->SqlArray[start];  //这是分支节点,然后比较它的分支节点,也就是2i
    for (int i = 2*start;i<length;i = i*2)
    {
        //获取左右结点中比较大的值的坐标
        if (i<length && pList->SqlArray[i] < pList->SqlArray[i+1])
        {
            i++;
        }
        //如果根节点本来就大,无序调整
        if (temp > pList->SqlArray[i])
        {
            break;
        }
        //交换值,将左右结点大值放在根节点
        pList->SqlArray[start] = pList->SqlArray[i];
        start = i;

    }
    //将开始需要比较的值,放在最后交换出的位置上
    pList->SqlArray[start] = temp;

}

4、代码分析

程序中一开始构建,调整大根堆,最大值是length/2,因为从完全二叉树的概念上分析:

image

在上图中大根堆的建立,就是调整前四个元素的位置,就是放再分支节点上还是叶子结点上,所以只要输入4即可。

image

一开始大根堆,发现是90在最前面。

首先,将位于第一位(根节点树最大),然后和最后一位交换,然后调整前8位(第九位已经是最大了)。

然后,再讲获取到的80,和最后一位(第九位,第十已经不需交换),然后调整前7位,当然都是从1开始了。

最后经过一次次循环调整,完成算法的排序。

其中关键的思想是获取调整堆排序,比如一开始90和20交换后,20位于第一位置;此时20和左右结点中的较大值80交换,关键是后续继续拿20和后面左右结点比较,直到break,也就是找到比它小的,跳出,然后赋值。

三、性能分析

1、简单选择排序

从简单选择排序的过程来看,它最大的特点就是交换移动数据次数相当少,这样也就节约了相应的时间。分析它的时间复杂度,无论最好最差的情况,其比较次数都是一样多,第i趟排序需要进行n-i次关键字的比较,此时需要n-1 +...+1 = n(n - 1)/2次。而对于交换次数而言,当最好的时候,交换次数为0,最差的时候,也就初始降序时,交换次数为n-1次。总的时间复杂度依然为O(n2)。

    尽管简单选择排序与冒泡排序同为O(n2),但简单选择排序的性能上还是要优于冒泡排序的。

2、堆排序

堆排序是一种不稳定的排序方法。

因为在堆的调整过程中,关键字进行比较和交换所走的是该结点到叶子结点的一条路径。

在程序运行时主要消耗在初始化构建堆和重建堆的反复刷选上。在初始化构建堆时,是从非终结点开始,其实比较两次,本来时n/2,这样最多对n/2进行两次比较工作,所以初始化构建大根堆是O(n)。

在调整构建堆时,第i次构建树logI(根据完全二叉树性质),需要遍历N-1记录,所以时间复杂度是O(nlogn)

posted @ 2015-09-17 16:39  bldong  阅读(4752)  评论(0编辑  收藏  举报