[UOJ#130][BZOJ4198][Noi2015]荷马史诗

[UOJ#130][BZOJ4198][Noi2015]荷马史诗

试题描述

追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

输入

输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

输出

输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

输入示例

6 3
1
1
3
3
9
9

输出示例

36
3

数据规模及约定

对于所有数据,保证 2≤n≤100000,2≤k≤9。

题解

这题没啥好说的,k 进制 Huffman 编码。

注意当 (n-1) mod (k-1) > 0 时,需要补 0,因为最终的 Huffman 树(其实就是 Trie 树)必须是一个满 k 叉树。

题目还要求最大深度最小,那么堆中比较大小的规则补充一下:当权重相同时,优先取深度更小的子树。

证明见算导(算导上只有二叉树的证明,但是 k 叉树的证明同理),核心思路就是先证最优编码一定对应一个满二叉树,再证每个集合中出现频率最小的两个元素一定放在最深层,并且二进制编码只差最后一位(即它们在树上是兄弟关系)。

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cstring>
#include <cctype>
#include <algorithm>
#include <queue>
using namespace std;
#define LL long long

const int BufferSize = 1 << 16;
char buffer[BufferSize], *Head, *Tail;
inline char Getchar() {
	if(Head == Tail) {
		int l = fread(buffer, 1, BufferSize, stdin);
		Tail = (Head = buffer) + l;
	}
	return *Head++;
}
LL read() {
	LL x = 0, f = 1; char c = Getchar();
	while(!isdigit(c)){ if(c == '-') f = -1; c = Getchar(); }
	while(isdigit(c)){ x = x * 10 + c - '0'; c = Getchar(); }
	return x * f;
}

#define maxn 100010

struct Node {
	LL val; int mxd;
	Node() {}
	Node(LL _, int __): val(_), mxd(__) {}
	bool operator < (const Node& t) const { return val != t.val ? val > t.val : mxd > t.mxd; }
};
priority_queue <Node> Heap;

int n, K;

int main() {
	n = read(); K = read();
	for(int i = 1; i <= n; i++) Heap.push(Node(read(), 0));
	while((n - 1) % (K - 1)) Heap.push(Node(0, 0)), n++;
	
	LL ans = 0;
	while(Heap.size() > 1) {
		LL sumv = 0; int mxd = 0;
		for(int c = 1; c <= K && !Heap.empty(); c++) {
			Node u = Heap.top(); Heap.pop();
			sumv += u.val; mxd = max(mxd, u.mxd);
		}
		ans += sumv; mxd++;
		Heap.push(Node(sumv, mxd));
	}
	printf("%lld\n%d\n", ans, Heap.top().mxd);
	
	return 0;
}

 

posted @ 2017-06-24 16:37  xjr01  阅读(369)  评论(0编辑  收藏  举报