poj 1521

题意：给你一个字符串，首先是计算出一个按正常编码的编码长度，其次是计算出一个用霍夫曼编码的编码长度，最后求正常编码的长度除以霍夫曼编码长度的值，保留一位小数。

思路：正常的编码长度的话，由于都是ASCII码值所以编码长度都为8，所以总长度就是8*字符串的长度Len,然后霍夫曼编码的话，discuss里面很多人都是用优先队列，用优先队列的话，就不用自己维护了，我没用采用优先队列，而是一直维护一个递减的数组，这样的效果和有优先队列是一样的。

霍夫曼编码的示意图

我在这里假设，A有10个，B有5个，C有3个，D有一个。

那么霍夫曼编码的话，就是这样编的。

而这道题是求霍夫曼编码的编码长度。

为什么C和D会比B要多一个编码长度，因为C和D在树枝上要比B要多一个分叉点，那么那个如果没有这个分叉点的话，C和D的编码长度就是和B的一样。

那么我们就可以首先用个把最少的两个字符数加起来，因为在现阶段每个字符都可以看出是只有一个0或者1编码编成的。然后把这两个字符合并起来，意思就是我可以看成没有D这个元素，而是有4个C。

这样就少了一个分叉点，这4个C又和5个B构成了一个分叉点。在现阶段，我们又可以把这5个B和4个C看成只有1个编码长度（0或1）构成的，然后把这两个字符的数加起来，在把这两个字符合并。

相当于只有10个A和9个B构成的。然后A就由0编码，B就由1编码，在把他们两个字符数相加，在合并，最后就相当于有19个A了。然后就编码就结束了。

这里或许有些人会不理解，其实你想，比如说D加了几次。首先D是在和C合并之前就加了一次，然后，D就被C包含了。然后C再和B合并之前有加了一次，这里就相当于D有又加了一次，最后B又包含了C，

最后B在和A合并之前又加了一次，这就可以说明。D是被加了3次的。D的编码长度也就是3，在上面图示上的D的编码也就是111.

每个分叉点的数目都是它下面所有的分支的数目和。而下面的分支在合并之前就加了一次。

 1 #include <stdio.h>
 2 #include <string.h>
 3 #include <stdlib.h>
 4 
 5 char inp[1000];
 6 
 7 int s[200];
 8 
 9 int cmp(const void *a,const void *b)
10 {
11     return (*(int *)b)-(*(int *)a);
12 }
13 
14 int main()
15 {
16     while(scanf("%s",inp),strcmp(inp,"END")!=0)
17     {
18         int ans=0;
19         memset(s,0,sizeof(s[0]));
20         int len=strlen(inp);
21         for(int i=0;i<len;i++)
22             s[inp[i]]++;
23         qsort(s,130,sizeof(s[0]),cmp);
24         if(s[0]==len) ans=len;
25         else while(s[0]!=len){
26             int i=0;
27             for(;s[i]!=0;i++);    //这里注意有个分号，目的是找出它的最小的那个点。
28                 ans+=s[--i];
29                 ans+=s[i-1];
30                 s[i-1]+=s[i];
31                 s[i]=0;
32             qsort(s,i,sizeof(s[0]),cmp);   //霍夫曼编码，是从最小的那两个开始编的。
33         }
34         printf("%d %d %.1f\n",len*8,ans,1.0*len*8/ans);
35         memset(inp,0,sizeof(inp));
36     }
37     return 0;
38 }

posted @ 2016-07-27 16:11 一个_小菜鸟阅读(1184) 评论(0) 收藏举报

刷新页面返回顶部

一个_小菜鸟

菜是原罪

poj 1521

公告