SDUT 3345 数据结构实验之二叉树六:哈夫曼编码
数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000MS Memory Limit: 65536KB
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Example Input
AAAAABCD THE_CAT_IN_THE_HAT
Example Output
64 13 4.9 144 51 2.8
DQE:
本题为哈夫曼树的简单考察,对应离散数学中的最优二叉树,最优二叉树的权=每个叶子节点的带权路径之和=除树根外所有节点权之和,具体原因随意举例即可知其恰好对应的倍数关系,本题采用优先队列循环取最小节点生成中间节点,每次取节点即累加权,当队列中仅剩一个元素时,和即为该最优二叉树的权。
优先队列参考资料:http://www.cnblogs.com/Mimick/p/6028654.html
1 #include <iostream> 2 #include <cstdio> 3 #include <cstring> 4 #include <queue> 5 6 using namespace std; 7 8 int main() 9 { 10 char s[10000]; 11 while(scanf("%s",s)!=EOF) 12 { 13 priority_queue < int,vector<int>,greater<int> > Q; 14 int len=strlen(s); 15 int i,max=0; 16 int count[256]={0}; 17 18 for(i=0;i<len;i++) 19 { 20 count[s[i]]++; 21 if(s[i]>max) 22 max=s[i]; 23 } 24 25 for(i=0;i<=max;i++) 26 { 27 if(count[i]!=0) 28 Q.push(count[i]); 29 } 30 31 int sum=0; 32 while(!Q.empty()) 33 { 34 int a=Q.top(); 35 Q.pop(); 36 if(!Q.empty()) 37 { 38 int b=Q.top(); 39 Q.pop(); 40 sum+=(a+b); 41 Q.push(a+b); 42 } 43 } 44 45 printf("%d %d %.1f\n",len*8,sum,len*8.0/sum); 46 } 47 return 0; 48 } 49 50 /*************************************************** 51 User name: *** 52 Result: Accepted 53 Take time: 0ms 54 Take Memory: 156KB 55 Submit time: 2016-11-03 20:28:53 56 ****************************************************/
本文来自:[ https://www.cnblogs.com/Leroscox ]
博主:[ MiK ]
——
非商业转载请附原文链接!
商业转载请获得博主许可!