【bzoj4198】【Noi2015】荷马史诗
4198: [Noi2015]荷马史诗
Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 2200 Solved: 1169
[Submit][Status][Discuss]
Description
追逐影子的人,自己就是影子。 ——荷马
Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
Input
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
Output
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
题解:
huffman树相关知识:
1.带权路径长度:$W_{PL} = \sum_{i=1}^{n} w_{i} l_{i}$ 其中$w_{i}$为每个叶子结点的权值,$l_{i}$为每个叶子结点到根的路径长度;
Huffman即WPL最小的二叉树;
每次选权值最小的两个点合并并加入一个权值为两个点权值和的新点;
直到只有一个点;(我太弱了所以还没有YY出证明,改天翻wiki吧)
满足WPL最小;
应用:huffman编码:
实际上huffman是为了解决:对字符串加密成二进制串,给出字符串中每个字符出现的次数,由于不能造成歧义所以必须要满足任何一个字符的二进制编码都不是另一个不同字符的二进制编码的前缀,使得整个加密后的二进制串长度最小;
完整的huffman就在上面建出来的树的边加上0 1 ,即变成一个字典树,每个点对应的二进制串即编码
回到原题
所以出题人就是想出个huffman树 , 只不过是k叉的;
最长字符串长度最短不是问题,优先队列实现的时候第二关键字为当前根最大深度即可;
k叉有点坑,需要补上(n - n%(k-1)) %(k-1)个权值为0的点;
1 #include<bits/stdc++.h> 2 #define ll long long 3 #define mk make_pair 4 #define fir first 5 #define sec second 6 using namespace std; 7 const int N=100010; 8 int n,k; 9 typedef pair<ll,ll> pii; 10 priority_queue<pii,vector<pii>,greater<pii> >q; 11 int main(){ 12 // freopen("bzoj4198.in","r",stdin); 13 // freopen("bzoj4198.out","w",stdout); 14 scanf("%d%d",&n,&k); 15 for(int i=1;i<=n;i++){ 16 ll x;scanf("%lld",&x); 17 q.push(mk(x,0)); 18 } 19 int lim=(k-1-(n-1)%(k-1))%(k-1); 20 for(int i=1;i<=lim;i++)q.push(mk(0,0)); 21 ll ansx=0,ansy=0; 22 while(!q.empty()){ 23 ll x=0,y=0; 24 for(int i=1;i<=k&&!q.empty();i++,q.pop()){ 25 pii u=q.top(); 26 x+=u.fir; 27 y=max(y,u.sec); 28 } 29 y++; 30 ansx+=x,ansy=max(ansy,y); 31 if(q.empty())break; 32 q.push(mk(x,y)); 33 } 34 printf("%lld\n%lld\n",ansx,ansy); 35 return 0; 36 } 37 38