第二次作业

《数据压缩导论（第4版）》Page 66

2 利用程序huff_enc和huff_dec进行以下操作（在每种情况下，利用由被压缩图像生成的码本）。

（a）对Sena、Sensin和Omaha图像时行编码。

文件名	压缩前大小	压缩后大小	压缩比
omaha	64kb	58kb	90 %
sinan	64kb	61kb	95%
sena	64kb	57kb	89%

4 一个信源从符号集A={a₁, a₂, a₃, a₄, a₅}中选择字母，概率为P（a₁）=0.15，P（a₂）=0.04，P（a₃）=0.26，P（a₄）=0.05，P（a₅）=0.50。

（a）计算这个信源的熵。

（b）求这个信源的霍夫曼码。

（c）求（b）中代码的平均长度及其冗余度。

答: (a) H=-∑p(a_i)logp(a_i)

=-0.15*log0.15-0.04*log0.04-0.26*log0.26-0.05*log0.05-0.5*log0.5

=1.818(bits/symbol)

(b) a_1:001

a_2:0000

a_3:01

a_4:0001

a_5:1

(c)平均长度L=3*0.15+4*0.04+2*0.26+4*0.05+1*0.5=1.83(bits/symbol)

冗余度=L-H=0.012

5 一个符号集A={a₁, a₂, a₃, a₄,}，其概率为P（a₁）=0.1，P（a₂）=0.3，P（a₃）=0.25，P（a₄）=0.35，使用以下过程找出一种霍夫曼码：

（a）本章概述的第一种过程：

（b）最小方差过程。

解释这两种霍夫曼码的区别。

答：（a）a_1:001

a_2:01

a_3:000

a_4:1

平均码长L=3*0.1+2*0.3+3*0.25+1*0.35=2

（b）a_1:11

a_2:01

a_3:10

a_4:00

平均码长L=2*0.1+2*0.3+2*0.25+2*0.35=2

第一种过程：

S²=0.1(3-2)²+0.3(2-2)²+0.25(3-2)²+0.35(1-2)²

=0.70

第二种过程：

S²=0.1(2-2)²+0.3(2-2)²+0.25(2-2)²+0.35(2-2)²

所以第二种过程比第一种过程优

6在本书配套的数据中有几个图像和语音文件。

(a) 编写一段程序，计算其中一些图像和语音文件的一阶熵。

(b) 选择一个图像文件，计算其二阶熵。试解释一阶熵与二阶熵的差别。

(c) 对于(b)中所有的图像文件，计算其相邻像素之差的熵，试解释你的发现。

答：

文件名	一阶熵	二阶熵	差分熵
BERK.RAW	7.151537	6.705169	8.976150
GABE.RAW	7.116338	6.654578	8.978236
EARTH.IMG	4.770801	2.568358	3.962697
OMAHA.IMG	6.942426	4.488626	6.286834
SENA.IMG	6.834299	3.625204	3.856989
SENSIN.IMG	7.317944	4.301673	4.541547
test.txt	4.315677	3.122731	6.099982

图像文件的二阶熵小于差分熵小于一阶熵

posted @ 2015-09-06 10:26 屈艳红阅读(126) 评论(0) 编辑收藏举报

刷新页面返回顶部

屈艳红

第二次作业

公告