SDUT 3345 数据结构实验之二叉树六:哈夫曼编码
数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000 ms Memory Limit: 65536 KiB
Problem Description
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
Input
输入数据有多组,每组数据一行,表示要编码的字符串。
Output
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
Sample Input
AAAAABCD THE_CAT_IN_THE_HAT
Sample Output
64 13 4.9 144 51 2.8
提示:哈夫曼编码等于其各叶子结点乘以其前缀码代表的权值之和,所以可用优先队列将其求出。
代码实现如下(g++):
#include<bits/stdc++.h> using namespace std; int main() { priority_queue<int, vector<int>, greater<int> >q;//优先队列,每次入队后都会将队内元素从小到大排列 int i,num,a,b,sum; char c[1010]; int v[1010];//用整形数组来记录各字符出现的次数 while(cin>>c) { sum=0; memset(v,0,sizeof(v));//清空数组 int n=strlen(c); for(i=0;i<n;i++) { v[c[i]]++; } for(i=0;i<200;i++) { if(v[i]) { q.push(v[i]); } } while(!q.empty()) { a=q.top(); q.pop(); if(!q.empty()) { b=q.top(); q.pop(); num=a+b; q.push(num);//比如第一组数据,每次变化如下:1115、125、35 sum+=num;//每次更新为2、5、13 } } printf("%d %d %.1lf\n",n*8,sum,(n*8.0)/sum); } return 0; } /*************************************************** Result: Accepted Take time: 0ms Take Memory: 196KB ****************************************************/