数据结构第十节(排序(下))
排序
快速排序
快速排序的思想同规定排序一样,也是一种分而治之的思想。
不同的是,在快速排序中,分的方法如何分。
快速排序的逻辑思路
1.首先从集合中选出一个元素,把大于他的元素和小于他的元素分别分成2组,例如{1,3,5,9,6,2,4},选择元素4为分割点,整个集合被分为了{1,3,2}∪{4}∪{5,6,9}。(不难发现,其实所选出的那个截断点,集合分割后也已经确定了他在完全排好序时位置,在这个例子中一定是第4个元素)。
2.接着上面的例子,已经得到了两个分出来的集合,递归的再对这两个集合进行操作下去,就会使整个数组有序。
那么快速排序问题的关键就在于如何很快的把一个集合以一个合适的点分成2块。首先要做的就是选取分割点,然后是根据分割点将集合划分为2块。
选取分割点最常规的做法是"取中",即每次对于一个集合,取他的左边界和右边界和中间的中位数。例如上面的例子中,左边界为\(1\),右边界\(4\),中间值\(9\),选择这三个数字的中位数4作为分割点,整个集合被分为了{1,3,2}∪{4}∪{5,6,9}。
集合和划分为两块常用的做法为,先将左边键中间值右边界调整好顺序,选取中间值做分割点,并且将其于右边界减一位置的元素交换。之后进入死循环,循环的,从左边开始找大于等于分割点的元素low,从右边开始找小于等于分割点的元素high,如果找到的这2个点low<high,交换他们,否则代表已经成功分割,退出循环。
注意到在需要排的元素不多时,快速排序的性能甚至不如插入排序,可以设定一个阈值,如果左右边界相差大于100则进行快速排序,否则直接插入排序。
快速排序的代码实现
//插入排序
void Insertion_Sort(int array[], int n) {
for (int i = 1; i < n; i++)
{
int temp = array[i];
int j = 0;
for (j = i; j > 0 && array[j - 1] > temp; j--)
{
array[j] = array[j - 1];
}
array[j] = temp;
}
}
//交换
void Swap(int* a, int* b) {
int temp = *a;
*a = *b;
*b = temp;
}
//寻找分割点
int Mid(int array[],int left,int right) {
int mid = (left + right) / 2;
if (array[mid] < array[left]) {
Swap(&array[mid], &array[left]);
}
if (array[right] < array[mid]) {
Swap(&array[mid], &array[right]);
}
if (array[mid] < array[left]) {
Swap(&array[mid], &array[left]);
}
//此时已达到array[left]<=array[mid]<=array[right]
//将array[mid]和array[right-1]交换
Swap(&array[mid], &array[right-1]);
return array[right - 1];
}
//递归迭代的快速排序
void QuickSort(int array[], int left, int right) {
//如果足够大进行快排,否则直接插入排序
if (right - left >= 100) {
int cutP = Mid(array, left, right);
int low = left, high = right-1;
while (true)
{
while (array[++low] < cutP);
while (array[--high] > cutP);
if (low < high) {
Swap(&array[high], &array[low]);
}
else {
break;
}
}
Swap(&array[right-1], &array[low]);
QuickSort(array,left,low-1);
QuickSort(array, low+1,right);
}
else {
Insertion_Sort(array+left, right - left + 1);
}
}
//快速排序
void Quick_Sort(int array[],int n) {
QuickSort(array, 0, n - 1);
}
表排序
在对结构体做排序时,可以构建一个指针数组,排序交换只交换指针,排序结束再物理排序。
基数排序
桶排序
一种特殊的排序算法,可以将排序复杂度降低至\(O(N)\),但是对数据有要求,假如给定一个学校4万名学生的英语成绩,很明显这些成绩不可能大于100也不可能为负的。那么可以构建一个数组,每次读到一个数,就以该数字为下标的数组元素+1。输出时从下标0遍历到100,每次输出所保存值的下标次数个下标数字。
可以发现,当给定的数据范围过大且非常分散,该方法就不好用了,例如随机给定100个介于0~1亿之间的数排序。
次位优先的基术排序
对于所有的输入数据,首先先去他们的个位大小进行排序,依次放到对应的桶里,然后接着按照十位大小进行排序,依次放到对应的桶里,直到到达包含的数字的最高位数,便实现了一次基数排序。
所有排序的比较
课后习题(三个小题)
10-排序4 统计工龄 (20point(s))
给定公司N名员工的工龄,要求按工龄增序输出每个工龄段有多少员工。
输入格式:
输入首先给出正整数N(≤10^5),即员工总人数;随后给出N个整数,即每个员工的工龄,范围在[0, 50]。
输出格式:
按工龄的递增顺序输出每个工龄的员工个数,格式为:“工龄:人数”。每项占一行。如果人数为0则不输出该项。
输入样例:
8
10 2 0 5 7 2 5 2
输出样例:
0:1
2:3
5:2
7:1
10:1
#include<stdio.h>
#include<algorithm>
#include <string.h>
using namespace std;
int main(){
int N,temp;
scanf("%d\n",&N);
int arr[51];
memset(arr,0,sizeof(arr));
for(int i = 0;i<N;i++){
scanf("%d",&temp);
arr[temp]++;
}
for(int i = 0;i<=50;i++){
if(arr[i]!=0){
printf("%d:%d\n",i,arr[i]);
}
}
return 0;
}
10-排序5 PAT Judge (25point(s))
The ranklist of PAT is generated from the status list, which shows the scores of the submissions. This time you are supposed to generate the ranklist for PAT.
Input Specification:
Each input file contains one test case. For each case, the first line contains 3 positive integers, N (≤10^4), the total number of users, K (≤5), the total number of problems, and M (≤10^5), the total number of submissions. It is then assumed that the user id's are 5-digit numbers from 00001 to N, and the problem id's are from 1 to K. The next line contains K positive integers p[i] (i=1, ..., K), where p[i] corresponds to the full mark of the i-th problem. Then M lines follow, each gives the information of a submission in the following format:
user_id problem_id partial_score_obtained
where partial_score_obtained is either −1 if the submission cannot even pass the compiler, or is an integer in the range [0, p[problem_id]]. All the numbers in a line are separated by a space.
Output Specification:
For each test case, you are supposed to output the ranklist in the following format:
rank user_id total_score s[1] ... s[K]
where rank is calculated according to the total_score, and all the users with the same total_score obtain the same rank; and s[i] is the partial score obtained for the i-th problem. If a user has never submitted a solution for a problem, then "-" must be printed at the corresponding position. If a user has submitted several solutions to solve one problem, then the highest score will be counted.
The ranklist must be printed in non-decreasing order of the ranks. For those who have the same rank, users must be sorted in nonincreasing order according to the number of perfectly solved problems. And if there is still a tie, then they must be printed in increasing order of their id's. For those who has never submitted any solution that can pass the compiler, or has never submitted any solution, they must NOT be shown on the ranklist. It is guaranteed that at least one user can be shown on the ranklist.
Sample Input:
7 4 20
20 25 25 30
00002 2 12
00007 4 17
00005 1 19
00007 2 25
00005 1 20
00002 2 2
00005 1 15
00001 1 18
00004 3 25
00002 2 25
00005 3 22
00006 4 -1
00001 2 18
00002 1 20
00004 1 15
00002 4 18
00001 3 4
00001 4 2
00005 2 -1
00004 2 0
Sample Output:
1 00002 63 20 25 - 18
2 00005 42 20 0 22 -
2 00007 42 - 25 - 17
2 00001 42 18 18 4 2
5 00004 40 15 0 25 -
题解:
算法没有什么难度,主要是细节,搬一个别人的代码。
要点:
- 按照总分排序高低排序。
- 总分相同,那么按照答对题目个数(完全正确,拿满分)进行排序。
- 满足1、2条件,那么就需要按照学号进行排序。
- 一道题都没有提交或者提交但没有一道题通过编译的同学不计入排名。
- 提交没有通过编译的题目输出0,没有提交的题目输出“-”。
#include<stdio.h>
#include<algorithm>
using namespace std;
int v[10];
struct student{
int ID;
int score[6];
int ans;//总分
int flag; //输出标记 1为输出
int AC; // 满分的题目个数
}p[10005];
bool cmp(student a,student b){
if(a.ans!=b.ans)
return a.ans>b.ans;
else if(a.AC!=b.AC)
return a.AC>b.AC;
else
return a.ID<b.ID;
}
int main ()
{
int n,k,m;
scanf("%d %d %d",&n,&k,&m);
for(int i=1;i<=k;i++){
scanf("%d",&v[i]);
}
for(int i=1;i<=n;i++){
p[i].ID=i;
p[i].flag=0;
p[i].ans=p[i].AC=0;
for(int j=1;j<=k;j++){
p[i].score[j]=-1;
}
}
for(int i=0;i<m;i++){
int a,b,c;
scanf("%d %d %d",&a,&b,&c);
p[a].ID=a;
if(c>=0)
p[a].flag=1;
else {
if(p[a].score[b]==-1)
p[a].score[b]=0;
}
if(p[a].score[b]<c){
p[a].score[b]=c;
}
}
for(int i=1;i<=n;i++){
if(p[i].flag){
for(int j=1;j<=k;j++){
if(p[i].score[j]>=0)
p[i].ans+=p[i].score[j];
if(p[i].score[j]==v[j])
p[i].AC++;
}
}
}
sort(p+1,p+n+1,cmp);
int v=0,x=0x3f3f3f3f;
for(int i=1;i<=n;i++){
if(p[i].flag){
if(p[i].ans==x){
x=p[i].ans;
printf("%d %05d %d",v,p[i].ID,p[i].ans);
}
else{
v=i;
x=p[i].ans;
printf("%d %05d %d",i,p[i].ID,p[i].ans);
}
for(int j=1;j<=k;j++){
if(p[i].score[j]==-1)
printf(" -");
else
printf(" %d",p[i].score[j]);
}
printf("\n");
}
}
return 0;
}
10-排序6 Sort with Swap(0, i) (25point(s))
Given any permutation of the numbers {0, 1, 2,..., N−1}, it is easy to sort them in increasing order. But what if Swap(0, *) is the ONLY operation that is allowed to use? For example, to sort {4, 0, 2, 1, 3} we may apply the swap operations in the following way:
Swap(0, 1) => {4, 1, 2, 0, 3}
Swap(0, 3) => {4, 1, 2, 3, 0}
Swap(0, 4) => {0, 1, 2, 3, 4}
Now you are asked to find the minimum number of swaps need to sort the given permutation of the first N nonnegative integers.
Input Specification:
Each input file contains one test case, which gives a positive N (≤10^5) followed by a permutation sequence of {0, 1, ..., N−1}. All the numbers in a line are separated by a space.
Output Specification:
For each case, simply print in a line the minimum number of swaps need to sort the given permutation.
Sample Input:
10
3 5 7 2 6 4 9 0 8 1
Sample Output:
9
题解:
题目的意思是给定你一个数组,包括了{0.....n-1}的乱序,让你只用零交换,问多少次可以完成交换。运用的方法是表排序的物理排序方法,用环来解决。首先读入时我们用一个数组保存每个元素(下标代表)所在的位置。
循环1到n-1,如果他们不在应该在的位置上(array[i]!=i),那么就要想办法让他归位,首先从0的位置开始,0当前所在的位置,肯定是要和应该待在0位置的的数字来换,(假如0在第3个位置,肯定是要和3去换位置的),一直循环到0回到了自己的位置上。此时我们检查是否成功将i归位,如果没有成功归位,那么将0和i的位置互换。
#include<cstdio>
#include<cstdlib>
#include<cstdbool>
using namespace std;
void swap(int *a,int *b) {
int temp = *a;
*a = *b;
*b = temp;
}
int main() {
int n,t,array[100000],count = 0;
scanf("%d", &n);
for (int i = 0; i < n; i++)
{
scanf("%d", &t);
array[t] = i;
}
for (int i = 1; i < n; i++)
{
if (i != array[i]) {
while (array[0] != 0)
{
swap(&array[0], &array[array[0]]);
count++;
}
if (i != array[i]) {
swap(&array[0], &array[i]);
count++;
}
}
}
printf("%d\n", count);
return 0;
}