追逐影子的人,自己就是影子。 ——荷马
Allison 最近迷上了文学。她喜欢在一个慵懒的午后,细细地品上一杯卡布奇诺,静静地阅读她爱不释手的《荷马史诗》。但是由《奥德赛》和《伊利亚特》组成的鸿篇巨制《荷马史诗》实在是太长了,Allison 想通过一种编码方式使得它变得短一些。
一部《荷马史诗》中有 n 种不同的单词,从 1 到 n 进行编号。其中第 i 种单词出现的总次数为 wi。Allison 想要用 k 进制串 si 来替换第 i 种单词,使得其满足如下要求:
对于任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的前缀。
现在 Allison 想要知道,如何选择 si,才能使替换以后得到的新的《荷马史诗》长度最小。在确保总长度最小的情况下,Allison 还想知道最长的 si 的最短长度是多少?
一个字符串被称为 k 进制字符串,当且仅当它的每个字符是 0 到 k−1 之间(包括 0 和 k−1)的整数。
字符串 Str1 被称为字符串 Str2 的前缀,当且仅当:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字符串 Str2 的长度,Str2[1..t] 表示 Str2 的前 t 个字符组成的字符串。
Input输入文件的第 1 行包含 2 个正整数 n,k,中间用单个空格隔开,表示共有 n 种单词,需要使用 k 进制字符串进行替换。
接下来 n 行,第 i+1 行包含 1 个非负整数 wi,表示第 i 种单词的出现次数。
Output输出文件包括 2 行。
第 1 行输出 1 个整数,为《荷马史诗》经过重新编码以后的最短长度。
第 2 行输出 1 个整数,为保证最短总长度的情况下,最长字符串 si 的最短长度。
Sample Input4 2 1 1 2 2
Sample Output12 2
题意:s为k进制下单词的编码,在保证任何si都不是sj的前缀的前提下,使得所有字符的总和最短,并且在总和最短的前提下,保证此时最长单词的编码最小化。
题解:频率*长度的总和最短,这个提示很容易让我们想到哈夫曼树的性质;而前缀、k进制,又符合trie的性质,结合起来,显然是哈夫曼编码的性质。
将字符串出现的频率看作权值,将编码的长度看作到根节点的距离,我们可以直接计算一颗k叉哈夫曼树来得到答案。本题要求最长编码最短化,所以我们只要将比较器的第二维设置为当前深度即可。
即每次在小根堆中取出权值最小前提下合并次数也最小的k个值,进行哈夫曼树的贪心计算,需要注意的是,深度是边长而不是节点的层数。
//#include<bits/stdc++.h> #include<algorithm> #include <iostream> #include <cstdlib> #include <cstring> #include <cassert> #include <cstdio> #include <vector> #include <string> #include <cmath> #include <queue> #include <stack> #include <set> #include <map> using namespace std; #define P(a,b,c) make_pair(a,make_pair(b,c)) #define rep(i,a,n) for (int i=a;i<=n;i++) #define per(i,a,n) for (int i=n;i>=a;i--) #define CLR(vis) memset(vis,0,sizeof(vis)) #define MST(vis,pos) memset(vis,pos,sizeof(vis)) #define pb push_back #define mp make_pair #define all(x) (x).begin(),(x).end() #define fi first #define se second #define SZ(x) ((int)(x).size()) typedef pair<int,pair<int,int> >pii; typedef long long ll; typedef unsigned long long ull; const ll mod = 1000000007; const int INF = 0x3f3f3f3f; ll gcd(ll a, ll b) { return b ? gcd(b, a%b) : a; } template <class T> inline bool scan_d(T &ret) { char c; int sgn; if(c=getchar(),c==EOF) return 0; //EOF while(c!='?'&&(c<'0'||c>'9')) c=getchar(); sgn=(c=='?')?-1:1; ret=(c=='?')?0:(c-'0'); while(c=getchar(),c>='0'&&c<='9') ret=ret*10+(c-'0'); ret*=sgn; return 1; } inline void outt(int x) { if(x>9) outt(x/10); putchar(x%10+'0'); } const int MAXN = 1e5+10; int n,k; ll a; priority_queue<pair<ll,int> >q; int main() { ll ans=0; cin>>n>>k; rep(i,1,n)scan_d(a),q.push(make_pair(-a,-1)); int cnt=0; if((n-1)%(k-1)!=0) { cnt=n-1-(n-1)%(k-1); } while ((n-1)%(k-1)>0) n++,cout<<n<<endl,q.push(make_pair(0,1)); while(q.size()>1) { ll w=0; int d=0; rep(i,1,k) w-=q.top().first,d=max(d,-q.top().second),q.pop(); ans+=w; q.push(make_pair(-w,-d-1)); } cout<<ans<<endl<<-q.top().se-1<<endl;//深度是边长,要-- //不会出现最后一层只有一个数与很多零的情况(如果有这种情况实际深度要减一)。假设有这种情况,那么这时的(n-1)%(k-1)==0 //并不需要添0,矛盾 return 0; }