文章目录
  1. 1. 哈夫曼编码长度
    1. 1.1. 模拟做法
    2. 1.2. 分析与新解

引言:题是真的要多刷啊!


哈夫曼编码长度

来自:复旦大学研究生机试题目解析(2016-2018)

4.3 哈夫曼编码

题目:

给定一个字符串,求哈夫曼编码的最短长度。
输入:
aaaaabbbbcccdde
输出:
33

最开始我也按照模拟做了一下,因为不熟练,花了50分钟,debug了很久,很痛苦。

模拟做法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
#include<bits/stdc++.h>
using namespace std;
#define INF 0x3f3f3f3f

map<char,int> m;
char str[100010];
struct s{
char key;
int val;
bool leaf;
struct s *parent=NULL;
s(char key,int val,bool leaf,struct s *parent):key(key),val(val),leaf(leaf),parent(parent){}
};
struct cmp{
bool operator() (const s *a,const s *b)const{
return a->val>b->val;
}
};
int main(){
gets(str);
int len=strlen(str);
for(int i=0;i<len;i++){
++m[str[i]];
}
priority_queue<s*,vector<s*>,cmp > q;
for(map<char,int>::iterator iter=m.begin();iter!=m.end();iter++){
q.push(new s(iter->first,iter->second,true,nullptr));
}
while(q.top()->val<INF){
s *a=q.top();
q.pop();
s *b=q.top();
q.pop();
if(b->val>=INF){
q.push(a);
q.push(b);
break;
}
//printf("-a:%d,b:%d,",a->val,b->val);
s *c=new s(0,a->val+b->val,false,NULL);
a->val=INF;
b->val=INF;
a->parent=c;
b->parent=c;
q.push(a);
q.push(b);
q.push(c);
//printf("c:%d-\n",c->val);
}
int sum=0;
while(!q.empty()){
if(q.top()->leaf){
//printf("%c",q.top()->key);
int cnt=0;
s *tmp=q.top();
while(tmp->parent){
tmp=tmp->parent;
++cnt;
}
//printf("|%d*%d|\n",cnt,m[q.top()->key]);
sum+=cnt*m[q.top()->key];
}
q.pop();
}
printf("%d\n",sum);
return 0;
}

问题主要在于模拟时需要构建结构体,变量还需要是new出来的,要注意的地方很多,比方说priority_queue<s*,vector<s*>,cmp >,我的c++很久没用了,一开始写greater<s*>,但是bool operator < (const s &a) const{}貌似并不好用,才改为了struct s cmp{bool operator() (const s&a,const s&b){}},另外还要写构造函数,很麻烦。

分析与新解

https://blog.csdn.net/weixin_35093872/article/details/88055475

哈夫曼树的编码长度等于各个叶节点权值与路径长度乘积之和,同时这个值等于非叶节点之和。

缩减代码,并几分钟重新敲完:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
//哈夫曼树的编码长度等于各个叶节点权值与路径长度乘积之和,同时这个值等于非叶节点之和。
#include<bits/stdc++.h>
using namespace std;
#define INF 0x3f3f3f3f

map<char,int> m;
char str[100010];

int main(){
gets(str);
int len=strlen(str);
priority_queue<int,vector<int>,greater<int> > q;
for(int i=0;i<len;i++){
++m[str[i]];
}
for(map<char,int>::iterator iter=m.begin();iter!=m.end();iter++){
q.push(iter->second);
}
int sum=0;
while(!q.empty()){
int a=q.top();
q.pop();
if(q.empty()){
break;
}
int b=q.top();
q.pop();
q.push(a+b);
sum+=a+b;
}
printf("%d\n",sum);
return 0;
}

需要注意的是,如果要在队列里连续弹出两个元素,每次弹出之前都要判队列是否为空。

不得不说,复旦这道WSL的题出得相当好。

文章目录
  1. 1. 哈夫曼编码长度
    1. 1.1. 模拟做法
    2. 1.2. 分析与新解