从朋友测试ISAC和SILK效果到二者理论比较

之前写了关于ISAC的博客,但是SILK还没写

最近盛大开发ET的朋友测试了一下ISAC和SILK的效果。这里已经征求朋友同意并大力支持。

实验结果:SILK高码率更柔和,低码率(12kbps)会有背景噪声

              ISAC高码率和低码率有些机械,磁化明显但有接近电话声音。

(音质评估以人耳为主,可能存在主观倾向。但最终结果和编解码原理分析的结果一致。)

 

理论分析:

1. SILK虽然也分LTP分析和STP(LPC)分析,用来得到去除长时冗余和短时冗余。所谓长时冗余即是提取基音周期和增益。应该说借鉴了二元激励中的元音激励分析和短时谱冗余分析。但是没有开发辅音的类噪声分析。也没有使用白噪声计算噪声gain和残差矢量量化,而是使用噪声整形来处理。这里就使得量化噪声能均匀分布在多个频带。使得噪声不容易被感知。但这样的后果是在低码率下,噪声变得普遍很难被隐藏,所以这种做法会产生噪声,因为shaping已经不起作用。就像tone少噪声多,也就掩盖不住了。by the way,SILK使用了变长编码处理残差。

2. ISAC使用了传统的CELP二元激励分析,在细节上做了创新,例如在压缩Pitch Lag和Pitch Gain上使用了KLT算法后才量化,和传统的直接标量量化和矢量量化不同。并且在残差谱编码上没有直接在时域用噪声谱逼近。而是使用了频域处理,用FFT转换后对实部和虚部进行噪声逼近编码。应该说是比较少见的。至于编码效率提高多少有待研究。并且使用了算数编码。我强烈怀疑专利问题。据我所知,大量算数编码的基础专利在IBM手上,这也是算数编码很多年应用不多的原因。如果ISAC没有专利问题,那可能的解释是,据我回忆,IBM的基础算数编码专利在2009~2011年左右到期,可能是ISAC使用的编码方式不侵犯IBM专利和后期非基础性算数编码专利。

http://www.cnblogs.com/gaozehua/archive/2012/02/14/2350522.html

http://www.cnblogs.com/gaozehua/archive/2012/02/14/2350480.html

http://www.cnblogs.com/gaozehua/archive/2012/02/14/2350504.html

 

总结:ISAC在低码率(12K左右会好于SILK),高码率SILK会更显柔和。

posted @ 2012-03-29 17:00  杭州桓泽  阅读(1556)  评论(0编辑  收藏  举报