SDUT 3345 数据结构实验之二叉树六:哈夫曼编码

数据结构实验之二叉树六:哈夫曼编码

Time Limit: 1000MS Memory Limit: 65536KB

Problem Description

字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。

Input

 输入数据有多组,每组数据一行,表示要编码的字符串。

Output

 对应字符的ASCII编码长度lahuffman编码长度lhla/lh的值(保留一位小数),数据之间以空格间隔。

Example Input

AAAAABCD
THE_CAT_IN_THE_HAT

Example Output

64 13 4.9
144 51 2.8

DQE:

本题为哈夫曼树的简单考察,对应离散数学中的最优二叉树,最优二叉树的权=每个叶子节点的带权路径之和=除树根外所有节点权之和,具体原因随意举例即可知其恰好对应的倍数关系,本题采用优先队列循环取最小节点生成中间节点,每次取节点即累加权,当队列中仅剩一个元素时,和即为该最优二叉树的权。

优先队列参考资料:http://www.cnblogs.com/Mimick/p/6028654.html

 

 1 #include <iostream>
 2 #include <cstdio>
 3 #include <cstring>
 4 #include <queue>
 5 
 6 using namespace std;
 7 
 8 int main()
 9 {
10     char s[10000];
11     while(scanf("%s",s)!=EOF)
12     {
13         priority_queue < int,vector<int>,greater<int> > Q;
14         int len=strlen(s);
15         int i,max=0;
16         int count[256]={0};
17 
18         for(i=0;i<len;i++)
19         {
20             count[s[i]]++;
21             if(s[i]>max)
22                 max=s[i];
23         }
24 
25         for(i=0;i<=max;i++)
26         {
27             if(count[i]!=0)
28                 Q.push(count[i]);
29         }
30 
31         int sum=0;
32         while(!Q.empty())
33         {
34             int a=Q.top();
35             Q.pop();
36             if(!Q.empty())
37             {
38                 int b=Q.top();
39                 Q.pop();
40                 sum+=(a+b);
41                 Q.push(a+b);
42             }
43         }
44 
45         printf("%d %d %.1f\n",len*8,sum,len*8.0/sum);
46     }
47     return 0;
48 }
49 
50 /***************************************************
51 User name: ***
52 Result: Accepted
53 Take time: 0ms
54 Take Memory: 156KB
55 Submit time: 2016-11-03 20:28:53
56 ****************************************************/

 

posted @ 2016-11-04 22:14  Leroscox  阅读(941)  评论(0编辑  收藏  举报