五笔的编码和解码

问题:五笔的编码范围是a ~ y的25个字母,从1位到4位的编码,如果我们把五笔的编码按字典序排序,形成一个数组如下: 
    a, aa, aaa, aaaa, aaab, aaac, … …, b, ba, baa, baaa, baab, baac … …, yyyw, yyyx, yyyy 
其中a的Index为0,aa的Index为1,aaa的Index为2,以此类推。 
1)编写一个函数,输入是任意一个编码,比如baca,输出这个编码对应的Index; 

2)编写一个函数,输入是任意一个Index,比如12345,输出这个Index对应的编码。

解答:初看一下,编码并不是按照数位大小进行,而是按照字典序进行排序。首先通过枚举一些例子找找规律。

 

index[a]=0,index[aa]=1,index[aaa]=2,index[aaaa]=3,前四个字符串的规律是strlen(str)-1。

我们再看已知index[a]求index[b]。a,aa,aaaa,aaab,…,ayyy。其中aa->ay(25个数),aaa->ayy(25*25个数),aaaa->ayyy(25*25*25个数),这样index[b]=index[a]+25^3+25^2+25+1

再看已知index[aa]求index[ab]。aa,aaa,aaaa,aaab,…,aayy。其中aaa->aay(25个数),aaaa->aayy(25*25个数),这样index[ab]=index[aa]+25^2+25+1

再看已知index[aaa]求index[aab]。aaa,aaaa,…,aaay。其中aaaa->aaay(25个数)。这样index[aab]=index[aaa]+25+1

再看已知index[aaaa]求index[aaab]。index[aaab]=index[aaaa]+1。

这样我们就可以将上述因子放在一个数组里。factor[]={25^3+25^2+25+1,25^2+25+1,25+1,1}

我们以bdce为例说明。

对字符串从左到右遍历,首先发现的是b,b距离a的相对index=factor[0],而index[a]=0,所以到达b是factor[0];再看第二个字符d,bd距离ba的长度为factor[1]*(b-a),而ba距离b的长度又为1;所以到达bd是1+factor[0]+factor[1]*(b-a);再看第三个字符c,bdc到bda的长度为factor[2]*(c-a),而bda距离bd的长度又为1,所以到达bdc是1+1+factor[0]+factor[1]*(b-a)+factor[2]*(c-a);最后再看e,bdce到bdca的长度为factor[3]*(e-a),而bdca距离bdc的长度又为1,所以到达dbce是1+1+1+factor[0]+factor[1]*(b-a)+factor[2]*(c-a)。所以编码就出来了。

?
1
2
3
4
5
6
7
8
9
10
11
int  factor[]={25*25*25+25*25+25+1,25*25+25+1,25+1,1};
int  encode( char  *str)
{
     int  len= strlen (str);
     int  index=len-1;
     for ( int  i=0;i<len;++i)
     {
         index+=factor[i]*(str[i]- 'a' );
     }
     return  index;
}

 

对于第二个问题,解码就是编码的逆过程,也是顺序求字符串的1234个字符就行。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
char * decode( int  index)
{
     char  str[4];
     int  i=0;
     while (index>=0)
     {
         str[i]= 'a' +index/factor[i];
         index=index%factor[i];
         --index;
         ++i;
     }
     str[i]= '\0' ;
     return  str;
}


posted on 2013-09-11 19:33  新一  阅读(485)  评论(0编辑  收藏  举报

导航