追逐影子的人,自己就是影子。 ——荷马

Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。

Input输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。

接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。

Output输出文件包括 2 行。

第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。

Sample Input4 2 1 1 2 2

Sample Output12 2

题意:s为k进制下单词的编码,在保证任何si都不是sj的前缀的前提下,使得所有字符的总和最短,并且在总和最短的前提下,保证此时最长单词的编码最小化。
题解:频率*长度的总和最短,这个提示很容易让我们想到哈夫曼树的性质;而前缀、k进制,又符合trie的性质,结合起来,显然是哈夫曼编码的性质。
将字符串出现的频率看作权值,将编码的长度看作到根节点的距离,我们可以直接计算一颗k叉哈夫曼树来得到答案。本题要求最长编码最短化,所以我们只要将比较器的第二维设置为当前深度即可。
即每次在小根堆中取出权值最小前提下合并次数也最小的k个值,进行哈夫曼树的贪心计算,需要注意的是,深度是边长而不是节点的层数。

//#include<bits/stdc++.h>
#include<algorithm>
#include <iostream>
#include  <cstdlib>
#include  <cstring>
#include  <cassert>
#include   <cstdio>
#include   <vector>
#include   <string>
#include    <cmath>
#include    <queue>
#include    <stack>
#include      <set>
#include      <map>
using namespace std;
#define P(a,b,c) make_pair(a,make_pair(b,c))
#define rep(i,a,n) for (int i=a;i<=n;i++)
#define per(i,a,n) for (int i=n;i>=a;i--)
#define CLR(vis) memset(vis,0,sizeof(vis))
#define MST(vis,pos) memset(vis,pos,sizeof(vis))
#define pb push_back
#define mp make_pair
#define all(x) (x).begin(),(x).end()
#define fi first
#define se second
#define SZ(x) ((int)(x).size())
typedef pair<int,pair<int,int> >pii;
typedef long long ll;
typedef unsigned long long ull;
const ll mod = 1000000007;
const int INF = 0x3f3f3f3f;
ll gcd(ll a, ll b) {
	return b ? gcd(b, a%b) : a;
}
template <class T>
inline bool scan_d(T &ret) {
	char c;
	int sgn;
	if(c=getchar(),c==EOF) return 0; //EOF
	while(c!='?'&&(c<'0'||c>'9')) c=getchar();
	sgn=(c=='?')?-1:1;
	ret=(c=='?')?0:(c-'0');
	while(c=getchar(),c>='0'&&c<='9') ret=ret*10+(c-'0');
	ret*=sgn;
	return 1;
}
inline void outt(int x) {
	if(x>9) outt(x/10);
	putchar(x%10+'0');
}
const int MAXN = 1e5+10;
int n,k;
ll a;
priority_queue<pair<ll,int> >q;
int main() {
	ll ans=0;
	cin>>n>>k;
	rep(i,1,n)scan_d(a),q.push(make_pair(-a,-1));
	int cnt=0;
	if((n-1)%(k-1)!=0) {
		cnt=n-1-(n-1)%(k-1);
	}
	while ((n-1)%(k-1)>0) n++,cout<<n<<endl,q.push(make_pair(0,1));
	while(q.size()>1) {
		ll w=0;
		int d=0;
		rep(i,1,k) w-=q.top().first,d=max(d,-q.top().second),q.pop();
		ans+=w;
		q.push(make_pair(-w,-d-1));
	}
	cout<<ans<<endl<<-q.top().se-1<<endl;//深度是边长,要--
	//不会出现最后一层只有一个数与很多零的情况(如果有这种情况实际深度要减一)。假设有这种情况,那么这时的(n-1)%(k-1)==0
	//并不需要添0,矛盾 
	return 0;
}

 

发表评论

邮箱地址不会被公开。 必填项已用*标注