康托展开(计算字符串排列组合的算法)
1.康托展开(转载)
康托展开的公式是 X=an*(n-1)!+an-1*(n-2)!+...+ai*(i-1)!+...+a2*1!+a1*0! 其中,ai为当前未出现的元素中是排在第几个(从0开始)。
这个公式可能看着让人头大,最好举个例子来说明一下。例如,有一个数组 s = ["A", "B", "C", "D"],它的一个排列 s1 = ["D", "B", "A", "C"],现在要把 s1 映射成 X。n 指的是数组的长度,也就是4,所以
X(s1) = a4*3! + a3*2! + a2*1! + a1*0!
关键问题是 a4、a3、a2 和 a1 等于啥?
a4 = "D" 这个元素在子数组 ["D", "B", "A", "C"] 中是第几大的元素。"A"是第0大的元素,"B"是第1大的元素,"C" 是第2大的元素,"D"是第3大的元素,所以 a4 = 3。
a3 = "B" 这个元素在子数组 ["B", "A", "C"] 中是第几大的元素。"A"是第0大的元素,"B"是第1大的元素,"C" 是第2大的元素,所以 a3 = 1。
a2 = "A" 这个元素在子数组 ["A", "C"] 中是第几大的元素。"A"是第0大的元素,"C"是第1大的元素,所以 a2 = 0。
a1 = "C" 这个元素在子数组 ["C"] 中是第几大的元素。"C" 是第0大的元素,所以 a1 = 0。(因为子数组只有1个元素,所以a1总是为0)
所以,X(s1) = 3*3! + 1*2! + 0*1! + 0*0! = 20
A B C | 0
A C B | 1
B A C | 2
B C A | 3
C A B | 4
C B A | 5
通过康托逆展开生成全排列
如果已知 s = ["A", "B", "C", "D"],X(s1) = 20,能否推出 s1 = ["D", "B", "A", "C"] 呢?
因为已知 X(s1) = a4*3! + a3*2! + a2*1! + a1*0! = 20,所以问题变成由 20 能否唯一地映射出一组 a4、a3、a2、a1?如果不考虑 ai 的取值范围,有
3*3! + 1*2! + 0*1! + 0*0! = 20
2*3! + 4*2! + 0*1! + 0*0! = 20
1*3! + 7*2! + 0*1! + 0*0! = 20
0*3! + 10*2! + 0*1! + 0*0! = 20
0*3! + 0*2! + 20*1! + 0*0! = 20
等等。但是满足 0 <= ai <= n-1 的只有第一组。可以使用辗转相除的方法得到 ai,如下图所示:
知道了a4、a3、a2、a1的值,就可以知道s1[0] 是子数组["A", "B", "C", "D"]中第3大的元素 "D",s1[1] 是子数组 ["A", "B", "C"] 中第1大的元素"B",s1[2] 是子数组 ["A", "C"] 中第0大的元素"A",s[3] 是子数组 ["C"] 中第0大的元素"C",所以s1 = ["D", "B", "A", "C"]。
这样我们就能写出一个函数 Permutation3(),它可以返回 s 的第 m 个排列。
前面的内容从http://archive.cnblogs.com/a/2026276/转载。
代码如下:
1 #include<iostream> 2 #include<algorithm> 3 #include<vector> 4 #include<cstdlib> 5 using namespace std; 6 class cantor{ 7 public: 8 int n;//字符串的长度 9 string s; 10 int pos;//字符串在全排列中的字典位置,从0开始 11 vector<int>num;//所有的字符 12 cantor(string s):s(s){n=s.size();} 13 cantor(int n,int pos):n(n),pos(pos){ 14 int i; 15 for(i=0;i<n;i++) 16 num.push_back(i); 17 } 18 int fac(int); 19 void encode(); 20 void decode(); 21 22 }; 23 int cantor::fac(int num){ 24 if(num==0) return 1; 25 else return num*fac(num-1); 26 } 27 void cantor::encode(){ 28 int i,j,count; 29 vector<int>vec(n); 30 for(i=0;i<n;i++){ 31 count=0; 32 for(j=i;j<n;j++) 33 if(s[i]>s[j]) count++; 34 vec[n-i-1]=count; 35 } 36 pos=0; 37 for(i=0;i<s.size();i++) 38 pos+=vec[i]*fac(i); 39 } 40 void cantor::decode(){ 41 int i; 42 div_t divresult; 43 for(i=n-1;i>=0;i--){ 44 divresult=div(pos,fac(i));求余数与除数 45 s.push_back(num[divresult.quot]+'0'); 46 num.erase(num.begin()+divresult.quot); 47 pos=divresult.rem; 48 } 49 } 50 int main(){ 51 cantor test(4,2); 52 test.decode(); 53 cout<<test.s<<endl; 54 }
其中,div_t的功能:函数返回参数numerator/denominator的商和余数。
结构体div_t定义在stdlib.h中,包含以下内容:
int quot; //商数
int rem; //余数
例如,以下代码显示x/y的商和余数:
div_t temp;
temp=div(x,y);
printf("%d 除以%d等于%d余数%d\n",temp,quot,temp,rem);
2.我排第几个
描述
现在有"abcdefghijkl”12个字符,将其所有的排列中按字典序排列,给出任意一种排列,说出这个排列在所有的排列中是第几小的?
- 输入
- 第一行有一个整数n(0<n<=10000);
随后有n行,每行是一个排列; - 输出
- 输出一个整数m,占一行,m表示排列是第几位;
- 样例输入
-
3 abcdefghijkl hgebkflacdji gfkedhjblcia
- 样例输出
-
1 302715242 260726926
1 /* 2 3 题意: 4 5 给定一个由 a 到 l的不重复出现的字符串字符串,求该字符串按照字典序排列的所有序列中是第几小的 6 7 题解: 8 9 康托展开。。。。。http://zh.wikipedia.org/zh/康托展开 10 11 康托展开是一个双射,即不仅可以求是第几小,而且可以根据是第几小求出该排列 12 13 */ 14 #include <iostream> 15 #include <cstring> 16 17 using namespace std; 18 19 const int MAX = 12; 20 21 int fac[MAX + 1]; 22 23 void cal() //计算阶乘的 24 25 { 26 27 fac[0] = 1; 28 29 for(int i = 1; i <= MAX-1; ++i) 30 31 fac[i] = fac[i-1] * i; 32 33 } 34 35 int main() 36 37 { 38 39 int T; 40 41 char s[MAX + 1]; 42 43 cal(); 44 45 cin >> T; 46 47 while(T--) 48 49 { 50 51 cin >> s; 52 53 int len = strlen(s); 54 55 long long ans = 0; 56 57 for(int i = 0; i < len-1; ++i) 58 59 { 60 61 int count = 0; 62 63 for(int j = i + 1; j <= len-1; ++j) 64 65 if(s[i] > s[j]) 66 67 ++count; 68 69 ans += count * fac[len - i - 1]; 70 71 } 72 73 cout << ans + 1 << endl; 74 75 } 76 77 // while(1); 78 79 return 0; 80 81 }