把数组排成最小的数

题目:输入一个正整数数组,将它们连接起来排成一个数,输出能排出的所有数字中最小的一个。例如输入数组{32,  321},则输出这两个能排成的最小数字32132请给出解决问题的算法,并证明该算法。

分析:这是096月份百度新鲜出炉的一道面试题,从这道题我们可以看出百度对应聘者在算法方面有很高的要求。

这道题其实是希望我们能找到一个排序规则,根据这个规则排出来的数组能排成一个最小的数字。要确定排序规则,就得比较两个数字,也就是给出两个数字mn,我们需要确定一个规则mn哪个更大,而不是仅仅只是比较这两个数字的数值哪个更大。

根据题目的要求,两个数字mn排成的数字mnnm,如果mn<nm,那么我们应该输出mn,也就是m应该排在n的前面,也就是m小于n;反之,如果nm<mnn小于m。如果mn==mnm等于n

接下来我们考虑怎么去拼接数字,即给出数字mn,怎么得到数字mnnm并比较它们的大小。直接用数值去计算不难办到,但需要考虑到的一个潜在问题是mn都在int能表达的范围内,但把它们拼起来的数字mnnm就不一定能用int表示了。所以我们需要解决大数问题。一个非常直观的方法就是把数字转换成字符串。

另外,由于把数字mn拼接起来得到的mnnm,它们所含有的数字的个数肯定是相同的。因此比较它们的大小只需要按照字符串大小的比较规则就可以了。

基于这个思路,我们可以写出下面的代码:

 1 // Maxinum int number has 10 digits in decimal system
 2 const int g_MaxNumberLength = 10;
 3  
 4 // String buffers to combine two numbers
 5 char* g_StrCombine1 = new char[g_MaxNumberLength * 2 + 1];
 6 char* g_StrCombine2 = new char[g_MaxNumberLength * 2 + 1];
 7  
 8 // Given an array, print  the minimum number
 9 // by combining all numbers in the array
10 void PrintMinNumber(int* numbers, int length)
11 {
12     if(numbers == NULL || length <= 0)
13         return;
14  
15     // Convert all numbers as strings
16     char** strNumbers = (char**)(new int[length]);
17     for(int i = 0; i < length; ++i)
18     {
19         strNumbers[i] = new char[g_MaxNumberLength + 1];
20         sprintf(strNumbers[i], "%d", numbers[i]);
21     }
22  
23     // Sort all strings according to algorithm in function compare
24     qsort(strNumbers, length, sizeof(char*), compare);
25  
26     for(int i = 0; i < length; ++i)
27         printf("%s", strNumbers[i]);
28     printf("\n");
29  
30     for(int i = 0; i < length; ++i)
31         delete[] strNumbers[i];
32     delete[] strNumbers;
33 }
34  
35 // Compare two numbers in strNumber1 and strNumber2
36 // if [strNumber1][strNumber2] > [strNumber2][strNumber1],
37 // return value > 0
38 // if [strNumber1][strNumber2] = [strNumber2][strNumber1],
39 // return value = 0
40 // if [strNumber1][strNumber2] < [strNumber2][strNumber1],
41 // return value < 0
42 int compare(const void* strNumber1, const void* strNumber2)
43 {
44     // [strNumber1][strNumber2]
45     strcpy(g_StrCombine1, *(const char**)strNumber1);
46     strcat(g_StrCombine1, *(const char**)strNumber2);
47  
48     // [strNumber2][strNumber1]
49     strcpy(g_StrCombine2, *(const char**)strNumber2);
50     strcat(g_StrCombine2, *(const char**)strNumber1);
51  
52     return strcmp(g_StrCombine1, g_StrCombine2);
53 }

上述代码中,我们在函数compare中定义比较规则,并根据该规则用库函数qsort排序。最后把排好序的数组输出,就得到了根据数组排成的最小的数字。

找到一个算法解决这个问题,不是一件容易的事情。但更困难的是我们需要证明这个算法是正确的。接下来我们来试着证明。

首先我们需要证明之前定义的比较两个数字大小的规则是有效的。一个有效的比较需要三个条件:1.自反性,即a等于a2.对称性,即如果a大于b,则b小于a3.传递性,即如果a小于bb小于c,则a小于c。现在分别予以证明。

1.      

自反性。显然有aa=aa,所以a=a

2.       对称性。如果a小于b,则ab<ba,所以ba>ab。因此b大于a

3.       传递性。如果a小于b,则ab<ba。当ab用十进制表示的时候分别为l位和m位时,ab=a×10m+bba=b×10l+a。所以a×10m+b<b×10l+a。于是有a×10m-a< b×10l –b,即a(10m -1)<b(10l-1)。所以a/(10l -1)<b/(10m -1)

如果b小于c,则bc<cb。当c表示成十进制时为m位。和前面证明过程一样,可以得到b/(10m -1)<c/(10n -1)

所以a/(10l -1)< c/(10n -1)。于是a(10n -1)<c(10l -1),所以a×10n +c<c×10l +a,即ac<ca

所以a小于c

在证明了我们排序规则的有效性之后,我们接着证明算法的正确性。我们用反证法来证明。

我们把n个数按照前面的排序规则排好顺序之后,表示为A1A2A3…An。我们假设这样排出来的两个数并不是最小的。即至少存在两个xy0<x<y<n),交换第x个数和地y个数后,A1A2…Ay…Ax…An<A1A2…Ax…Ay…An

由于A1A2…Ax…Ay…An是按照前面的规则排好的序列,所以有Ax<Ax+1<Ax+2<…<Ay-2<Ay-1<Ay

由于Ay-1小于Ay,所以Ay-1Ay<AyAy-1。我们在序列A1A2…Ax…Ay-1Ay…An交换Ay-1Ay,有A1A2…Ax…Ay-1Ay…An<A1A2…Ax…AyAy-1…An(这个实际上也需要证明。感兴趣的读者可以自己试着证明)。我们就这样一直把Ay和前面的数字交换,直到和Ax交换为止。于是就有A1A2…Ax…Ay-1Ay…An<A1A2…Ax…AyAy-1…An< A1A2…Ax…AyAy-2Ay-1…An<…< A1A2…AyAx…Ay-2Ay-1…An

同理由于Ax小于Ax+1,所以AxAx+1<Ax+1Ax。我们在序列A1A2…AyAxAx+1…Ay-2Ay-1…An仅仅只交换AxAx+1,有A1A2…AyAxAx+1…Ay-2Ay-1…An<A1A2…AyAx+1Ax…Ay-2Ay-1…An。我们接下来一直拿Ax和它后面的数字交换,直到和Ay-1交换为止。于是就有A1A2…AyAxAx+1…Ay-2Ay-1…An<A1A2…AyAx+1Ax…Ay-2Ay-1…An<…< A1A2…AyAx+1Ax+2…Ay-2Ay-1Ax…An

所以A1A2…Ax…Ay…An< A1A2…Ay…Ax…An。这和我们的假设的A1A2…Ay…Ax…An <A1A2…Ax…Ay…An相矛盾。

所以假设不成立,我们的算法是正确的。

 

 

以上摘自何海涛博客

 

最初看到这题,有个想法就是从最高位到最低位依次比较大小,像比较字符串那样,较小值放在前面,但是这个想法是不对的。

摘录一段原文的评论说明:

 

2011-07-16 16:25
假如所有的数字中位数最长的长度为n,则把所有的数字的位数补齐为n【在后面加0】,然后升序sort,然后一个个首尾相接,接的时候再把补上的0去掉,这样得到的就是最小的吧~

回复
2011-07-17 16:39

假设两个数字,3、32和321,按照你的规则先补0,变成300、320和321.排序之后是300<320<321,首尾相接并去掉补齐的0,就是332321。这个数字大于321323。因此你的这个思路是不对的。

回复
2011-07-28 12:20
mandy 回复  何海涛
补第1个数字,拿您的例子来说,补3就行
回复
2011-09-25 11:01
test 回复 mandy
不仅仅是补第一个,而是补前n位,n是两个数的位数之差,实际上的思想和两个数字拼接起来一样的
回复
05-10 09:26
zz 回复 test
84 8485,补前两位,变为8884 8485,得到848584

回复
posted @ 2012-08-07 22:19  wolenski  阅读(261)  评论(0编辑  收藏  举报