【bzoj4198】[Noi2015]荷马史诗 贪心+堆
题目描述
追逐影子的人,自己就是影子。 ——荷马
Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
输入
输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
输出
输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
样例输入
4 2
1
1
2
2
样例输出
12
2
题解
贪心+堆
感觉这题和哈夫曼树的关系并不是很大啊~
先来说我的思考方法:
题目要求任意两个串不能有前缀关系,因此它们在Trie树上不能是祖先关系。
也就是说只有Trie树上的叶子结点才可以使用。
然后每个单词的长度就是它的深度。
现在要找出一种方式,使得所有单词的出现次数*长度的和最小。
我们把长度拆成一段一段的,即对于Trie树上的每一条边考虑,它增加的是它子树中叶子结点的出现次数之和。对于一棵子树,由它的儿子到达它,需要它所有子孙节点的出现次数之和。
我们把这个想象成儿子节点的合并过程,容易发现它与合并果子极为相似。当k=2时完全就是合并果子。
那么当k>2时也是一样的,优先挑k短的合并。然而可能存在一种情况:(n-1)%(k-1)>0,使得无法完美合并,这样无法保证答案的正确性。
考虑在其中加入出现次数为0的单词,答案一定不変,所以我们可以补0,直到能整除为止。
这样每次挑出堆中权值最小的点,权值相同则挑深度最小的,把它们合并即可。
然后网上的题解:
裸的k-哈夫曼树~
感觉自己完全是被骗了 = =
#include <cstdio> #include <queue> #define N 100010 using namespace std; typedef long long ll; typedef pair<ll , int> pr; priority_queue<pr> q; int main() { int n , k , i , d; ll s , ans = 0; scanf("%d%d" , &n , &k); for(i = 1 ; i <= n ; i ++ ) scanf("%lld" , &s) , q.push(pr(-s , 0)); while((n - 1) % (k - 1)) q.push(pr(0 , 0)) , n ++ ; while(q.size() > 1) { s = 0 , d = 0; for(i = 1 ; i <= k ; i ++ ) s += q.top().first , d = min(d , q.top().second) , q.pop(); ans -= s , q.push(pr(s , d - 1)); } printf("%lld\n%d\n" , ans , -q.top().second); return 0; }