单词words
论一类脑筋急转弯题和奇技淫巧题的解题技巧
【题意】
给定n个长为m且只包含xyz的字符串,定义两个字符串的相似程度为它们对应位置相同字符个数(比如xyz和yyz的相似程度为2,后两位相同),分别求出相似度为0~m的无序字符串对数。
【样例】
输入:
4 3
xyz
xyz
zzx
xzz
输出:
2
1
2
1
解释:
(xyz,zzx)(xyz,zzx)相似度为0,(zzx,xzz)相似度为1,(xyz,xzz) (xyz,xzz)相似度为2,(xyz,xyz)相似度为3。
【数据范围与约定】
共20个测试点。
对于测试点1,n<=10。
对于测试点2,3,n*m≤1000。
对于测试点4,所有单词都相同。
对于测试点5,m=1。
对于测试点6~10,所有单词只包含x和y这两个字符。
对于全部测试点,n*m<=100000。
注意时间限制是3s。
【解法】
不得不说这个题的解法真特么机智……脑筋急转弯……
先想暴力,暴力枚举C(n,2)个字符串对,每个对都用O(m)的时间暴力比较,复杂度O(n2m)。
观察一下数据范围,n*m<=100000。换句话说,m>30的时候直接暴力即可(经计算m=31时n2m=322419375,况且还有0.5的常数,实测无压力)。剩下的就只有m<=30的情况了。
如果换个方向考虑,可以发现字符串的种类是有限的(最多3m种)。所以,可以尝试对字符串三进制状压,然后只需枚举一遍字符串并从之前的所有3m种字符串中枚举获得答案即可。这样的复杂度是O(n3m),对于m=30的情况来说实在是太大了,经计算大概只能到m=7~8的级别(m=8时n3m=82012500,m=9时n3m=328036878,由于三进制常数比较大,实际上m=7的时候就已经T了,当然你也可以用四进制减小常数)。
这样就麻烦了,m<7的时候可以三进制暴力,m>30的时候可以直接暴力,中间那些7<=m<=30的情况怎么搞?
回过头来看暴力,对于每个字符串对我们是用暴力比较的方式得出相似度的。但其实没这个必要,m<=30的时候完全可以把它压成三个二进制数x,y,z,分别表示对应位为x,y,z的下标集合。这样比较的时候就可以用二进制位运算O(1)得出两串的相同部分的集合(也是二进制数),再O(1)数出里面的1的个数,比较就压到O(1)了。至于统计1个数,我用的是14年沈洋论文里的递推法,具体可以看沈洋的论文。
最后总结解法:
对于不同的m分类讨论。
m<7时,三进制状压暴力。
7<=m<=30时,压位后暴力。
m>30时,直接暴力。
贴个代码:
1 #include<cstdio> 2 #include<cstring> 3 #include<algorithm> 4 #include<string> 5 #define cntone(x) ((one[((x)&(65535))])+(one[((x)>>(16))])) 6 using namespace std; 7 const int maxn=100010; 8 int n,m,one[maxn]={0},cnt[maxn]={0},x[maxn],y[maxn],z[maxn],pw[maxn]; 9 long long ans[maxn]={0}; 10 char c[maxn]; 11 string s[maxn]; 12 int main(){ 13 scanf("%d%d",&n,&m); 14 for(int i=1;i<=n;i++){ 15 scanf("%s",c); 16 s[i]=c; 17 } 18 if(m<7){ 19 pw[0]=1; 20 for(int i=1;i<=m;i++)pw[i]=pw[i-1]*3; 21 for(int i=1;i<=n;i++){ 22 int val=0; 23 for(int j=0;j<m;j++)val=val*3+s[i][j]-'x'; 24 for(int k=0;k<pw[m];k++){ 25 int tmp=0; 26 for(int j=0;j<m;j++)if((k/pw[j])%3==(val/pw[j])%3)tmp++; 27 ans[tmp]+=cnt[k]; 28 } 29 cnt[val]++; 30 } 31 } 32 else if(m<31){ 33 for(int i=1;i<65536;i++)one[i]=one[i>>1]+(i&1); 34 for(int i=1;i<=n;i++){ 35 for(int j=0;j<m;j++){ 36 if(s[i][j]=='x')x[i]|=1<<j; 37 else if(s[i][j]=='y')y[i]|=1<<j; 38 else z[i]|=1<<j; 39 } 40 for(int j=1;j<i;j++)ans[cntone((x[i]&x[j])|(y[i]&y[j])|(z[i]&z[j]))]++; 41 } 42 } 43 else{ 44 for(int i=1;i<=n;i++)for(int j=1;j<i;j++){ 45 int tmp=0; 46 for(int k=0;k<m;k++)if(s[i][k]==s[j][k])tmp++; 47 ans[tmp]++; 48 } 49 } 50 for(int i=0;i<=m;i++)printf("%lld\n",ans[i]); 51 return 0; 52 }
【后记】
好像m>30的时候也可以压位优化(多压几个int),不过懒得写了。
这题真特么脑筋急转弯……被今天的三道脑筋急转弯题坑惨了……