全排列和全组合
原文 http://wuchong.me/blog/2014/07/28/permutation-and-combination-realize/
全排列
所谓全排列,就是打印出字符串中所有字符的所有排列。例如输入字符串abc
,则打印出 a、b、c 所能排列出来的所有字符串 abc
、acb
、bac
、bca
、cab
和 cba
。
一般最先想到的方法是暴力循环法,即对于每一位,遍历集合中可能的元素,如果在这一位之前出现过了该元素,跳过该元素。例如对于abc
,第一位可以是 a 或 b 或 c 。当第一位为 a 时,第二位再遍历集合,发现 a 不行,因为前面已经出现
a 了,而 b 和 c 可以。当第二位为 b 时 , 再遍历集合,发现 a 和 b 都不行,c 可以。可以用递归或循环来实现,但是复杂度为 $O(n^n)$ 。有没有更优雅的解法呢。
首先考虑bac
和cba
这二个字符串是如何得出的。显然这二个都是abc
中的
a 与后面两字符交换得到的。然后可以将abc
的第二个字符和第三个字符交换得到acb
。同理可以根据bac
和cba
来得bca
和cab
。
因此可以知道 全排列就是从第一个数字起每个数分别与它后面的数字交换,也可以得出这种解法每次得到的结果都是正确结果,所以复杂度为 O(n!)。找到这个规律后,递归的代码就很容易写出来了:
#include<stdio.h> #include<string> //交换两个字符 void Swap(char *a ,char *b) { char temp = *a; *a = *b; *b = temp; } //递归全排列,start 为全排列开始的下标, length 为str数组的长度 void AllRange(char* str,int start,int length) { if(start == length-1) { printf("%s\n",str); } else { for(int i=start;i<=length-1;i++) { //从下标为start的数开始,分别与它后面的数字交换 Swap(&str[start],&str[i]); AllRange(str,start+1,length); Swap(&str[start],&str[i]); } } } void Permutation(char* str) { if(str == NULL) return; AllRange(str,0,strlen(str)); } void main() { char str[] = "abc"; Permutation(str); } |
去重的全排列
为了得到不一样的排列,可能我们最先想到的方法是当遇到和自己相同的就不交换了。如果我们输入的是abb
,那么第一个字符与后面的交换后得到 bab
、bba
。然后abb
中,第二个字符和第三个就不用交换了。但是对于bab
,它的第二个字符和第三个是不同的,交换后得到bba
,和之前的重复了。因此,这种方法不行。
因为abb
能得到bab
和bba
,而bab
又能得到bba
,那我们能不能第一个bba
不求呢?
我们有了这种思路,第一个字符a
与第二个字符b
交换得到bab
,然后考虑第一个字符a
与第三个字符b
交换,此时由于第三个字符等于第二个字符,所以它们不再交换。再考虑bab
,它的第二个与第三个字符交换可以得到bba
。此时全排列生成完毕,即abb
、bab
、bba
三个。
这样我们也得到了在全排列中去掉重复的规则:去重的全排列就是从第一个数字起每个数分别与它后面非重复出现的数字交换。用编程的话描述就是第i个数与第j个数交换时,要求[i,j)中没有与第j个数相等的数。下面给出完整代码:
#include<stdio.h> #include<string> //交换两个字符 void Swap(char *a ,char *b) { char temp = *a; *a = *b; *b = temp; } //在 str 数组中,[start,end) 中是否有与 str[end] 元素相同的 bool IsSwap(char* str,int start,int end) { for(;start<end;start++) { if(str[start] == str[end]) return false; } return true; } //递归去重全排列,start 为全排列开始的下标, length 为str数组的长度 void AllRange2(char* str,int start,int length) { if(start == length-1) { printf("%s\n",str); } else { for(int i=start;i<=length-1;i++) { if(IsSwap(str,start,i)) { Swap(&str[start],&str[i]); AllRange2(str,start+1,length); Swap(&str[start],&str[i]); } } } } void Permutation(char* str) { if(str == NULL) return; AllRange2(str,0,strlen(str)); } void main() { char str[] = "abb"; Permutation(str); } |
全组合
如果不是求字符的所有排列,而是求字符的所有组合应该怎么办呢?还是输入三个字符 a、b、c,则它们的组合有a
b
c
ab
ac
bc
abc
。当然我们还是可以借鉴全排列的思路,利用问题分解的思路,最终用递归解决。不过这里介绍一种比较巧妙的思路
—— 基于位图。
假设原有元素 n 个,则最终组合结果是 $2^n-1$ 个。我们可以用位操作方法:假设元素原本有:a,b,c 三个,则 1 表示取该元素,0 表示不取。故取a
则是001
,取ab
则是011
。所以一共三位,每个位上有两个选择
0 和 1。而000
没有意义,所以是$2^n-1$个结果。
这些结果的位图值都是 1,2…2^n-1。所以从值 1 到值 $2^n-1$ 依次输出结果:
001
,010
,011
,100
,101
,110
,111
。对应输出组合结果为:a
,b
,ab
,c
,ac
,bc
,abc
。
因此可以循环 1~2^n-1,然后输出对应代表的组合即可。有代码如下:
#include<stdio.h> #include<string.h> void Combination(char *str) { if(str == NULL) return ; int len = strlen(str); int n = 1<<len; for(int i=1;i<n;i++) //从 1 循环到 2^len -1 { for(int j=0;j<len;j++) { int temp = i; if(temp & (1<<j)) //对应位上为1,则输出对应的字符 { printf("%c",*(str+j)); } } printf("\n"); } } void main() { char str[] = "abc"; Combination(str); } |
迭代法
#include <string.h> #include <stdio.h> void combine(char s[], int n, int m, char * subset, int sub_len) { if(m == 0) { *(subset+sub_len) = '\0'; printf("%s\n",subset); return; } for(int i = n; i >= m; i--) { subset[m-1] = s[i-1]; combine(s, i-1, m-1, subset,sub_len); } } int main() { char s[]= "abcd"; int length = strlen(s); for(int m=1;m<=length-1;++m) { char* subset = new char[m+1]; if(subset != NULL) { combine(s,length,m,subset,m); delete [] subset; } else { return 0; } } return 0; }
参考资料
-EOF-