第一次作业

1—1  数据压缩的一个基本问题是“我们要压缩什么”,对此你是怎样理解的?

              答:  所谓信号空间即被压缩对象,是指物理空间,时间区间,电池频段。也就是指某信号集合所占的空域、时域、和频域空间。信号空间的这几种形式是相互关联的,存储空间的减少也意味着传输效率的提高与占用宽带的节省,也就是说,只有采用某种方法来减少某一种信号空间,就能压缩数据。

1—2  数据压缩的另一个基本问题是“为什么进行压缩”,对此你又是怎样理解的?

              答:数据压缩能较快的传输各种信源——时间域的压缩;在现有通信干线上开通更多的并行业务——频率域的压缩;降低发射功率——能量域的压缩;紧缩数据存储容量— —空间域的压缩。这些将使社会效益、经济效益、将越来越明显,相反,若不进行数据压缩,则无论传输或存储都很难实用化。

1—6  数据压缩技术是如何分类的?

              答:数据压缩分为可逆压缩和不可逆压缩。可逆压缩也叫做无失真、无差错编码或无噪声编码。不可压缩就是失真编码。有冗余度的就可以压缩,压缩只能在一定限度内可  逆,超过此限度,必然带来失真,允许的失真越大,压缩的比例也可以越多。

3、给定符号集A={a1,a2,a3,a4},求一下条件下的一阶熵:

     (a)P(a1)=P(a2)=P(a3)=P(a4)=1/4

     (b)P(a1)=1/2 , P(a2)=1/4 , P(a3)=P(a4)=1/8

      (c)P(a1)=0.505 , P(a2)=1/4 , P(a3)=1/4 , P(a4)=0.12

        (a)解:P(a1)=P(a2)=P(a3)=P(a4)=1/4

                H=-log21/4*1/4*4

                  =2bit

         (b)P(a1)=1/2 , P(a2)=1/4 , P(a3)=P(a4)=1/8

                H=-log21/2*1/2-log21/4*1/4-log21/8*1/8*2

                  =1.75bit

         (c)P(a1)=0.505 , P(a2)=1/4 , P(a3)=1/4 , P(a4)=0.12

                H=-log20.505*0.505-log21/4*1/4*2-log20.12*0.12

                  =1-log20.505*0.505-log20.12*0.12(bit)

 5、考虑以下序列:

                 ATGCTTAACGTGCTTAACCTGAAGCTTCCGCTGAAGAACCTG

                 CTGAACCCGCTTAAGCTTAAGCTGAACCTTCTGAACCTGCTT

        (a)根据此序列估计个概率值,并计算这一序列的一阶、二阶、三阶和四阶熵。

             A的个数为21,T的个数为23,G的个数为16,C的个数为24.

             p(A)=1/4, p(T)=23/84, P(G)=4/21, P(C)=2/7

            一阶熵为:-log21/4*1/4*21-log223/84*23/84*23-log24/21*4/21*16-log22/7*2/7*24

                         =21/2-log223/84*23/84*23-log24/21*4/21*16-log22/7*2/7*24(bit)

            二阶熵为:

        (b)根据这些熵,能否推断此序列具有什么样的结构?

7、做一个实验,看看一个模型能够多么准确地描述一个信源。

        (a)编写一段程序,从包括26个字母的符号集{a,b,...,z}中随机选择字母,组成100个四字母单词,这些单词中有多少是有意义的?

posted on 2015-08-27 18:07  刘莉*  阅读(230)  评论(0编辑  收藏  举报