把数组排成最小的数

题目：输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题的算法，并证明该算法。

分析：这是09年6月份百度新鲜出炉的一道面试题，从这道题我们可以看出百度对应聘者在算法方面有很高的要求。

这道题其实是希望我们能找到一个排序规则，根据这个规则排出来的数组能排成一个最小的数字。要确定排序规则，就得比较两个数字，也就是给出两个数字m和n，我们需要确定一个规则m和n哪个更大，而不是仅仅只是比较这两个数字的数值哪个更大。

根据题目的要求，两个数字m和n排成的数字mn和nm，如果mn<nm，那么我们应该输出mn，也就是m应该排在n的前面，也就是m小于n；反之，如果nm<mn，n小于m。如果mn==mn，m等于n。

接下来我们考虑怎么去拼接数字，即给出数字m和n，怎么得到数字mn和nm并比较它们的大小。直接用数值去计算不难办到，但需要考虑到的一个潜在问题是m和n都在int能表达的范围内，但把它们拼起来的数字mn和nm就不一定能用int表示了。所以我们需要解决大数问题。一个非常直观的方法就是把数字转换成字符串。

另外，由于把数字m和n拼接起来得到的mn和nm，它们所含有的数字的个数肯定是相同的。因此比较它们的大小只需要按照字符串大小的比较规则就可以了。

基于这个思路，我们可以写出下面的代码：

 1 // Maxinum int number has 10 digits in decimal system
 2 const int g_MaxNumberLength = 10;
 3  
 4 // String buffers to combine two numbers
 5 char* g_StrCombine1 = new char[g_MaxNumberLength * 2 + 1];
 6 char* g_StrCombine2 = new char[g_MaxNumberLength * 2 + 1];
 7  
 8 // Given an array, print  the minimum number
 9 // by combining all numbers in the array
10 void PrintMinNumber(int* numbers, int length)
11 {
12     if(numbers == NULL || length <= 0)
13         return;
14  
15     // Convert all numbers as strings
16     char** strNumbers = (char**)(new int[length]);
17     for(int i = 0; i < length; ++i)
18     {
19         strNumbers[i] = new char[g_MaxNumberLength + 1];
20         sprintf(strNumbers[i], "%d", numbers[i]);
21     }
22  
23     // Sort all strings according to algorithm in function compare
24     qsort(strNumbers, length, sizeof(char*), compare);
25  
26     for(int i = 0; i < length; ++i)
27         printf("%s", strNumbers[i]);
28     printf("\n");
29  
30     for(int i = 0; i < length; ++i)
31         delete[] strNumbers[i];
32     delete[] strNumbers;
33 }
34  
35 // Compare two numbers in strNumber1 and strNumber2
36 // if [strNumber1][strNumber2] > [strNumber2][strNumber1],
37 // return value > 0
38 // if [strNumber1][strNumber2] = [strNumber2][strNumber1],
39 // return value = 0
40 // if [strNumber1][strNumber2] < [strNumber2][strNumber1],
41 // return value < 0
42 int compare(const void* strNumber1, const void* strNumber2)
43 {
44     // [strNumber1][strNumber2]
45     strcpy(g_StrCombine1, *(const char**)strNumber1);
46     strcat(g_StrCombine1, *(const char**)strNumber2);
47  
48     // [strNumber2][strNumber1]
49     strcpy(g_StrCombine2, *(const char**)strNumber2);
50     strcat(g_StrCombine2, *(const char**)strNumber1);
51  
52     return strcmp(g_StrCombine1, g_StrCombine2);
53 }

上述代码中，我们在函数compare中定义比较规则，并根据该规则用库函数qsort排序。最后把排好序的数组输出，就得到了根据数组排成的最小的数字。

找到一个算法解决这个问题，不是一件容易的事情。但更困难的是我们需要证明这个算法是正确的。接下来我们来试着证明。

首先我们需要证明之前定义的比较两个数字大小的规则是有效的。一个有效的比较需要三个条件：1.自反性，即a等于a；2.对称性，即如果a大于b，则b小于a；3.传递性，即如果a小于b，b小于c，则a小于c。现在分别予以证明。

自反性。显然有aa=aa，所以a=a。

2. 对称性。如果a小于b，则ab<ba，所以ba>ab。因此b大于a。

3. 传递性。如果a小于b，则ab<ba。当a和b用十进制表示的时候分别为l位和m位时，ab=a×10^m+b，ba=b×10^l+a。所以a×10^m+b<b×10^l+a。于是有a×10^m-a< b×10^l –b，即a(10^m -1)<b(10^l-1)。所以a/(10^l -1)<b/(10^m -1)。

如果b小于c，则bc<cb。当c表示成十进制时为m位。和前面证明过程一样，可以得到b/(10^m -1)<c/(10ⁿ -1)。

所以a/(10^l -1)< c/(10ⁿ -1)。于是a(10ⁿ -1)<c(10^l -1)，所以a×10ⁿ +c<c×10^l +a，即ac<ca。

所以a小于c。

在证明了我们排序规则的有效性之后，我们接着证明算法的正确性。我们用反证法来证明。

我们把n个数按照前面的排序规则排好顺序之后，表示为A₁A₂A₃…A_n。我们假设这样排出来的两个数并不是最小的。即至少存在两个x和y（0<x<y<n），交换第x个数和地y个数后，A₁A₂…A_y…A_x…A_n<A₁A₂…A_x…A_y…A_n。

由于A₁A₂…A_x…A_y…A_n是按照前面的规则排好的序列，所以有A_x<A_x+1<A_x+2<…<A_y-2<A_y-1<A_y。

由于A_y-1小于A_y，所以A_y-1A_y<A_yA_y-1。我们在序列A₁A₂…A_x…A_y-1A_y…A_n交换A_y-1和A_y，有A₁A₂…A_x…A_y-1A_y…A_n<A₁A₂…A_x…A_yA_y-1…A_n（这个实际上也需要证明。感兴趣的读者可以自己试着证明）。我们就这样一直把A_y和前面的数字交换，直到和A_x交换为止。于是就有A₁A₂…A_x…A_y-1A_y…A_n<A₁A₂…A_x…A_yA_y-1…A_n< A₁A₂…A_x…A_yA_y-2A_y-1…A_n<…< A₁A₂…A_yA_x…A_y-2A_y-1…A_n。

同理由于A_x小于A_x+1，所以A_xA_x+1<A_x+1A_x。我们在序列A₁A₂…A_yA_xA_x+1…A_y-2A_y-1…A_n仅仅只交换A_x和A_x+1，有A₁A₂…A_yA_xA_x+1…A_y-2A_y-1…A_n<A₁A₂…A_yA_x+1A_x…A_y-2A_y-1…A_n。我们接下来一直拿A_x和它后面的数字交换，直到和A_y-1交换为止。于是就有A₁A₂…A_yA_xA_x+1…A_y-2A_y-1…A_n<A₁A₂…A_yA_x+1A_x…A_y-2A_y-1…A_n<…< A₁A₂…A_yA_x+1A_x+2…A_y-2A_y-1A_x…A_n。