数据结构之排序

一、基本概念：

1、排序：按照一定的关键字，将一个序列排列成想要得到的一个新的序列。

2、 内部排序和外部排序：整个排序过程完全在内存中进行，叫做内部排序。数据量较大需要借助外部存储设备才能完成，叫做外部排序。

3、 主关键字和次关键字：

4、 排序的稳定性：对于相同的元素来说，在排序之前和之后的顺序是一样的，那么这种排序就是稳定的排序，如果顺序发生了变化，那么就是不稳定排序。

　一、插入排序 1）直接插入排序　　2）折半插入排序　　3）希尔排序

　　　　二、交换排序　　 1）冒泡排序　　　　2）快速排序

　　　　三、选择排序　　1）简单选择排序　　2）堆排序

　　　　四、归并排序

　　　　五、基数排序

一、插入排序

（一）思想：在一个已经排好序的序列中，将未被排进的元素按照原先的规定插入到指定位置。

（二）分类：

1）直接插入排序 算法演示 返回目录

① 思想：最基本的插入排序，将第i个插入到前i-1个中的适当位置。

② 时间复杂度：T(n) = O(n²)。

③ 空间复杂度：S(n) = O(1)。

④ 稳定性：稳定排序。循环条件while(r[0].key < r[j].key)保证的。

　　时间复杂度：平均情况—O(n²) 最坏情况—O(n²) 辅助空间：O(1) 稳定性：稳定

void InsSort(RecordType r[], int length)
{
for(i = 2; I <= length; i++)
{
r[0] = r[i];
j = i – 1;
while(r[0].key < r[j].key) //每次先和前一个元素比，因为前面所有的元素都已有序，如果比前一个元素大，则比前面所有元素都大，直接逃过该轮
{
r[j + 1] = r[j]; //如果比前一个元素小，则把前一个元素移到当前位置
1. j = j – 1; //当前位置减一，继续和前一个元素比
}
r[j+1] = r[0];
}
}

算法中引进的附加记录R[0]称监视哨或哨兵(Sentinel)。

哨兵有两个作用：

① 进人查找(插入位置)循环之前，它保存了R[i]的副本，使不致于因记录后移而丢失R[i]的内容；

② 它的主要作用是：在查找循环中"监视"下标变量j是否越界。一旦越界(即j=0)，因为R[0].key和自己比较，循环判定条件不成立使得查找循环结束，从而避免了在该循环内的每一次均要检测j是否越界(即省略了循环判定条件"j>=1")。

注意：

① 实际上，一切为简化边界条件而引入的附加结点(元素)均可称为哨兵。

2）折半插入排序 返回目录

① 思想：因为是已经确定了前部分是有序序列，所以在查找插入位置的时候可以用折半查找的方法进行查找，提高效率。

② 时间复杂度：比较时的时间减为O(n㏒n)，但是移动元素的时间耗费未变，所以总是得时间复杂度还是O(n²)。

③ 空间复杂度：S(n) = O(1)。

④ 稳定性：稳定排序。

　　时间复杂度：平均情况—O(n²) 稳定性：稳定

void BinSort(RecordType r[], int length)
{
for(i = 2; i <= length; i++)
{
x = r[i];
low = 1; high = i – 1;
while(low <= high)
{
mid = (low + high) / 2;
if(x.key < r[mid].key)
high = mid – 1;
else
low = mid – 1;
}
for(j = i – 1; j >= low; --j)
r[j + 1] = r[j];
r[low] = x;
}
}

3）希尔排序算法演示 返回目录

① 思想：又称缩小增量排序法。把待排序序列分成若干较小的子序列，然后逐个使用直接插入排序法排序，最后再对一个较为有序的序列进行一次排序，主要是为了减少移动的次数，提高效率。原理应该就是从无序到渐渐有序，要比直接从无序到有序移动的次数会少一些。

② 时间复杂度：O(n的1.5次方)

③ 空间复杂度：O(1)

④ 稳定性：不稳定排序。{2,4,1,2}，2和1一组4和2一组，进行希尔排序，第一个2和最后一个2会发生位置上的变化。

　时间复杂度：理想情况—O(nlog₂n) 最坏情况—O(n²) 稳定性：不稳定

void ShellInsert(RecordType r[], int length, int delta)
{
for(i = 1 + delta; i <= length; i++)/*1+delta为第一个子序列的第二个元素的下表*/
if(r[i].key < r[1 - delta].key)
{
r[0] = r[i];
for(j = i – delta; j > 0 && r[0].key < r[j].key; j -=delta)
r[j + delta] = r[j];
r[j + delta] = r[0];
}
}
void ShellSort(RecordType r[], int length, int delta[], int n)
{
for(i = 0; i <= n – 1; ++i)
ShellInsert(r, length, delta[i]);
}

二、交换排序

（一）思想：通过交换逆序元素进行排序的方法。

（二）分类：

1）冒泡排序算法演示 返回目录

① 思想：反复扫描待排序序列，在扫描的过程中顺次比较相邻的两个元素的大小，若逆序就交换位置。第一趟，从第一个数据开始，比较相邻的两个数据，（以升序为例）如果大就交换，得到一个最大数据在末尾；然后进行第二趟，只扫描前n-1个元素，得到次大的放在倒数第二位。以此类推，最后得到升序序列。如果在扫描过程中，发现没有交换，说明已经排好序列，直接终止扫描。所以最多进行n-1趟扫描。

② 时间复杂度：T(n) = O(n²)。

③ 空间复杂度：S(n) = O(1)。

④ 稳定性：稳定排序。

　　时间复杂度：平均情况—O(n²) 最坏情况—O(n²) 辅助空间：O(1) 稳定性：稳定

void BubbleSort(RecordType r[], int length)
{
n = length;
change = TRUE;
for(i = 1; i <= n – 1 && change; i++)
{
change = FALSE;
for(j = 1; j <= n – I; ++j)
if(r[j].key > r[j + 1].key)
{
x = r[j];
r[j] = r[j + 1];
r[j + 1] = x;
change = TRUE;
}
}
}

2）快速排序算法演示 返回目录

① 思想：冒泡排序一次只能消除一个逆序，为了能一次消除多个逆序，采用快速排序。以一个关键字为轴，从左从右依次与其进行对比，然后交换，第一趟结束后，可以把序列分为两个子序列，然后再分段进行快速排序，达到高效。

② 时间复杂度：平均T(n) = O(n㏒n)，最坏O(n²)。

③ 空间复杂度：S(n) = O(㏒n)。

④ 稳定性：不稳定排序。{3， 2， 2}

　　时间复杂度：平均情况—O(nlog₂n) 最坏情况—O(n²) 辅助空间：O(log₂n) 稳定性：不稳定

void QKSort(RecordType r[], int low, int high)
{
int pos;
if(low < high)
{
pos = QKPass(r, low, high);
QKSort(r, low, pos - 1);
QKSort(r, pos + 1, high);
}
}
int QKPass(RecordType r[], int left, int right)
{
RecordType x;
int low, high;
x = r[left];
low = left;
high = right;
while(low < high)
{
while(low < high && r[high].key >= x.key)
high--;
if(low < high)
{
r[low] = r[high];
low++;
}
while(low < high && r[low].key < x.key)
low++;
if(low < high)
{
r[high] = r[low];
high--;
}
}
r[low] = x;
return low;
}

三、选择排序

（一）思想：每一趟在n – i + 1 ( i = 1,2, … , n - 1)个记录中选取关键字最小的记录作为有序序列中的第i个记录。

（二）分类：

1）简单选择排序算法演示 返回目录

① 思想：第一趟时，从第一个记录开始，通过n – 1次关键字的比较，从n个记录中选出关键字最小的记录，并和第一个记录进行交换。第二趟从第二个记录开始，选择最小的和第二个记录交换。以此类推，直至全部排序完毕。

② 时间复杂度：T(n) = O(n²)。

③ 空间复杂度：S(n) = O(1)。

④ 稳定性：不稳定排序，{3， 3， 2}。

时间复杂度：平均情况—O(n²) 最坏情况—O(n²) 辅助空间：O(1) 稳定性：不稳定

void SelectSort(RecordType r[], int length)
{
n = length;
for(i = 1; i <= n - 1; i++)
{
k = i;
for(j = i + 1; j <= n; i++)
if(r[j].key < r[k],key)
k = j;
if(k != i)
{
x = r[i];
r[i] = r[k];
r[k] = x;
}
}
}

2）堆排序算法演示 返回目录

① 思想：把待排序记录的关键字存放在数组r[1…n]中，将r看成是一刻完全二叉树的顺序表示，每个节点表示一个记录，第一个记录r[1]作为二叉树的根，一下个记录r[2…n]依次逐层从左到右顺序排列，任意节点r[i]的左孩子是r[2i]，右孩子是r[2i+1]，双亲是r[i/2向下取整]。然后对这棵完全二叉树进行调整建堆。

② 时间复杂度：T(n) = O(n㏒n)。

③ 空间复杂度：S(n) = O(1)。

④ 稳定性：不稳定排序。{5， 5， 3}

时间复杂度：平均情况—O(nlog₂n) 最坏情况—O(nlog₂n) 辅助空间：O(1) 稳定性：不稳定

(1) 调整堆：

void sift(RecordType r[], int k, int m)
{
/*假设r[k...m]是以r[k]为根的完全二叉树，而且分别以r[2k]和r[2k+1]为根的左右子树为大根堆，调整r[k]，使整个序列r[k...m]满足堆的性质*/
t = r[k];/*暂存“根”记录r[k]*/
x = r[k].key;
i = k;
j = 2 * i;
finished = FALSE;
while(j <= m && !finished)
{
if(j < m && r[j].key < r[j + 1].key)
j = j + 1;/*若存在右子树，且右子树根的关键字大，则沿右分支“筛选”*/
if(x >= r[j].key)
finished = TRUE;/*筛选完毕*/
else
{
r[i] = r[j];
i = j;
j = 2 * i;
}/*继续筛选*/
}
r[i] = t;/*将r[k]填入到恰当的位置*/
}

(2) 建初堆：

1 void crt_heap(recordType r[], int length)  
2 {  
3     n = length;  
4     for(i = n / 2; i >= 1; --i)/*自第n/2向下取整 个记录开始进行筛选建堆*/  
5         sift(r, i, n);  
6 }

(3) 堆排序：

 1 void HeapSort(RecordType r[], int length)  
 2 {  
 3     crt_heap(r, length);  
 4     n = length;  
 5     for(i = n; i >= 2; --i)  
 6     {  
 7         b = r[1];/*将堆顶记录和堆中的最后一个记录互换*/  
 8         r[1] = r[i];  
 9         r[i] = b;  
10         sift(r, 1, i - 1);/*进行调整，使r[1…i-1]变成堆*/  
11     }  
12 }

四、归并排序 算法演示 返回目录

① 思想：假设初始序列右n个记录，首先将这n个记录看成n个有序的子序列，每个子序列的长度为1，然后两两归并，得到n/2向上取整个长度为2（n为奇数时，最后一个序列的长度为1）的有序子序列。在此基础上，在对长度为2的有序子序列进行两两归并，得到若干个长度为4的有序子序列。如此重复，直至得到一个长度为n的有序序列为止。

② 时间复杂度：T(n) = O(n㏒n)。

③ 空间复杂度：S(n) = O(n)。

④ 稳定性：稳定排序。

　　　　时间复杂度：平均情况—O(nlog₂n) 最坏情况—O(nlog₂n) 辅助空间：O(n) 稳定性：稳定

void Merge(RecordType r1[], int low, int mid, int high, RecordType r2[])
{
/*已知r1[low...mid]和r1[mid + 1...high]分别按关键字有序排列，将它们合并成一个有序序列，存放在r2[low...high]*/
i = low;
j = mid + 1;
k = low;
while((i <= mid) && (j <= high))
{
if(r1[i].key <= r1[j].key)
{
r2[k] = r1[i];
++i;
}
else
{
r2[k] = r1[j];
++j;
}
++k;
}
while(i <= mid)
{
r2[k] = r1[i];
k++;
i++;
}
while(j <= high)
{
r2[k] = r1[j];
k++;
j++;
}
}
void MSort(RecordType r1[], int low, int high, RecordType r3[])
{
/*r1[low...high]经过排序后放在r3[low...high]中，r2[low...high]为辅助空间*/
RecordType r2[N];
if(low == high)
r3[low] = r1[low];
else
{
mid = (low + high) / 2;
MSort(r1, low, mid, r2);
MSort(r1, mid + 1, high, r2);
Merge(r2, low, mid, high, r3);
}
}
void MergeSort(RecordType r[], int n)
{
/*对记录数组r[1...n]做归并排序*/
MSort(r, 1, n, r);
}

五、基数排序 算法演示 返回目录

　　时间复杂度：平均情况—O(d(n+rd)) 最坏情况—O(d(n+rd)) 辅助空间：O(rd) 稳定性：稳定

void Distribute(SLList &L, int i, ArrType &f, ArrType &e) {

  // 静态链表L的r域中记录已按(keys[0],...,keys[i-1])有序，

  // 本算法按第i个关键字keys[i]建立RADIX个子表，

  // 使同一子表中记录的keys[i]相同。f[0..RADIX-1]和e[0..RADIX-1]

  // 分别指向各子表中第一个和最后一个记录。

  int j, p;

  for (j=0; j < RADIX; ++j) f[j] = 0;     // 各子表初始化为空表

  for (p=L.r[0].next;  p;  p=L.r[p].next) {

    j = L.r[p].keys[i]-'0';  // 将记录中第i个关键字映射到[0..RADIX-1]，

    if (!f[j]) f[j] = p;

    else L.r[e[j]].next = p;

    e[j] = p;                // 将p所指的结点插入第j个子表中

  }

} // Distribute    

  

void Collect(SLList &L, int i, ArrType f, ArrType e) {

  // 本算法按keys[i]自小至大地将f[0..RADIX-1]所指各子表依次链接成

  // 一个链表，e[0..RADIX-1]为各子表的尾指针

  int j,t;

  for (j=0; !f[j]; j++);  // 找第一个非空子表，succ为求后继函数: ++

  L.r[0].next = f[j];  // L.r[0].next指向第一个非空子表中第一个结点

  t = e[j];

  while (j < RADIX) {

    for (j=j+1; j < RADIX && !f[j]; j++);       // 找下一个非空子表

    if (j < RADIX) // 链接两个非空子表

      { L.r[t].next = f[j];  t = e[j]; }

  }

  L.r[t].next = 0;   // t指向最后一个非空子表中的最后一个结点

} // Collect    

  

void RadixSort(SLList &L) {

   // L是采用静态链表表示的顺序表。

   // 对L作基数排序，使得L成为按关键字自小到大的有序静态链表，

   // L.r[0]为头结点。

   int i;

   ArrType f, e;

   for (i=1; i < L.recnum; ++i) L.r[i-1].next = i;

   L.r[L.recnum].next = 0;     // 将L改造为静态链表

   for (i=0; i < L.keynum; ++i) {

      // 按最低位优先依次对各关键字进行分配和收集

      Distribute(L, i, f, e);    // 第i趟分配

      Collect(L, i, f, e);       // 第i趟收集

      print_SLList2(L, i);

   }

} // RadixSort

七、总结：

（1）简单排序法一般只用于n较小的情况（例如n<30）。当序列的记录“基本有序”时，直接插入排序是最佳的排序方法。如果记录中的数据较多，则应采用移动次数较少的简单选择排序法。

（2）快速排序、堆排序和归并排序的平均时间复杂度均为O(n㏒n)，但实验结果表明，就平均时间性能而言，快速排序是所有排序方法中最好的。遗憾的是，快速排序在最坏情况下的时间性能为O(n²)。堆排序和归并排序的最坏时间复杂度仍为O(n㏒n)，当n较大时，归并排序的时间性能优于堆排序，但它所需的辅助空间最多。

（3）可以将简单排序法与性能较好的排序方法结合使用。例如，在快速排序中，当划分子区间的长度小于某值时，可以转而调用直接插入排序法；或者先将待排序序列划分成若干子序列，分别进行直接插入排序，然后再利用归并排序法，将有序子序列合并成一个完整的有序序列。

（4）基数排序的时间复杂度可以写成O(d·n)。因此，它最适合于n值很大而关键字的位数d较小的序列。当d远小于n时，其时间复杂度接近O(n)。

（5）从排序的稳定性上来看，在所有简单排序法中，简单选择排序是不稳定的，其他各种简单排序法都是稳定的。然而，在那些时间性能较好的排序方法中，希尔排序、快速排序、堆排序都是不稳定的，只有归并排序、基数排序是稳定的。

排序方法平均时间最坏时间辅助存储

简单排序 O(n2) O(n2) O(1)

快速排序 O(nlogn) O(n2) O(logn)

堆排序 O(nlogn) O(nlogn) O(1)

归并排序 O(nlogn) O(nlogn) O(n)

基数排序 O(d(n+rd)) O(d(n+rd)) O(rd)

PS:直接插入排序、冒泡排序为简单排序，希尔排序、堆排序、快速排序为不稳定排序

一、时间性能按平均的时间性能来分，有三类排序方法：时间复杂度为O(nlogn)的方法有：快速排序、堆排序和归并排序，其中以快速排序为最好；时间复杂度为O(n2)的有：直接插入排序、起泡排序和简单选择排序，其中以直接插入为最好，特别是对那些对关键字近似有序的记录序列尤为如此；时间复杂度为O(n)的排序方法只有，基数排序。当待排记录序列按关键字顺序有序时，直接插入排序和起泡排序能达到O(n)的时间复杂度;而对于快速排序而言，这是最不好的情况，此时的时间性能蜕化为O(n2)，因此是应该尽量避免的情况。简单选择排序、堆排序和归并排序的时间性能不随记录序列中关键字的分布而改变。

二、空间性能指的是排序过程中所需的辅助空间大小。 1. 所有的简单排序方法(包括：直接插入、起泡和简单选择)和堆排序的空间复杂度为O(1)； 2. 快速排序为O(logn)，为栈所需的辅助空间; 3. 归并排序所需辅助空间最多，其空间复杂度为O(n ); 4.链式基数排序需附设队列首尾指针，则空间复杂度为O(rd )。

三、排序方法的稳定性能 1. 稳定的排序方法指的是，对于两个关键字相等的记录，它们在序列中的相对位置，在排序之前和经过排序之后，没有改变。 2. 当对多关键字的记录序列进行LSD方法排序时，必须采用稳定的排序方法。 3. 对于不稳定的排序方法，只要能举出一个实例说明即可。 4. 快速排序和堆排序是不稳定的排序方法

文章来源 http://blog.csdn.net/wzyhb123456789/article/details/5974790

posted on 2014-04-18 23:11 飞鸟快跑阅读(539) 评论(0) 收藏举报