上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页
摘要: 上一节对分数基音周期搜索作了文字说明, 笔者画了几幅图,对分数基音周期搜索里的升抽样进一步说明 图1: 表示一个带限的离散时间信号的傅里叶变换,它必然是以2 pi为周期的函数. 图2: 当我们用 t[n]=1当n%3==0 对语音信号进行抽样时, ... 阅读全文
posted @ 2012-04-16 13:38 飞天大蟾蜍 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 忽然想起关于g711的还什么都没有写,这里稍微提一下 g711压缩率为2:1 g711实际上的算法原理是利用一系列的折线段,代替log曲线 从代码上看,即非线性量化,即将语音信号分成几个大区间,每个区间的量化精度不同 这可能是基于这么一个事实,即振幅... 阅读全文
posted @ 2012-04-12 09:24 飞天大蟾蜍 阅读(87) 评论(0) 推荐(0) 编辑
摘要: 基音周期搜索,是自适应码本搜索的一个重要依据, 自适应码本的搜索就是在基音周期附近进行的. 和g723的基音周期搜索不同,g729的基音周期搜索搜索也更为精细 g729把基音周期的搜索分成3段,取了每一段中自相关的极值, 三段区间分别为[20,39] ... 阅读全文
posted @ 2012-04-11 23:09 飞天大蟾蜍 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 不同于g723固定系数的共振峰感知加权 g729的共振峰感知加权是自适应的. perc_var 这个函数来对共振峰感加权进行估值 我们先看itu的文档 3.3节 的式30, 这是一个判断语音频谱是否平坦的一个条件. 因为人类语音的频谱有个特点,越高频的... 阅读全文
posted @ 2012-04-11 14:06 飞天大蟾蜍 阅读(35) 评论(0) 推荐(0) 编辑
摘要: g729编码分析了大部分,编码总体框架和g723有些类似. 均是基于lpc分析的码本激励编码. g729提供了更低的编码延迟(10ms) g729的第一步Pre_Process照样是高通滤波,滤除低频噪声. Coder_ld8k 为编码主体函数 A... 阅读全文
posted @ 2012-04-11 11:08 飞天大蟾蜍 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 分析g729的一些零碎笔记,原来随手扔在新浪微博,太零碎了,这里做一个汇总。 729感知加权的问题,同723一样,仍然对高频分量做一个估值,高频低,则认为频谱是倾斜的。 要感知加权的时候应做适当的补偿。 因为人类的语音信息,在前两个共振峰能量较大,高频共... 阅读全文
posted @ 2012-03-28 14:14 飞天大蟾蜍 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 偶尔听到的互相关在除语音以外的一个典型应用,用户个性化推荐 大概是就,一个网页(或者视频什么的),分成好几个维度(比如:体育类,财经类,娱乐类,将这些维度作为x轴) 网页在每个维度都会有一定的比重 (根据关键词出现的频率,比出现"乔丹"很多次,则可以归入体... 阅读全文
posted @ 2012-03-04 23:26 飞天大蟾蜍 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 完成了g723,打算先看看g729.大致扫了一篇编解码框图. 都是基于10阶线性预测(10e lpc) 看到了熟悉的莱文森德宾递推,基音周期搜索等。 感知加权滤波器的设计有所不同。 自适应激励与固定码本激励部分基本都差不太多。 g729的处... 阅读全文
posted @ 2012-01-30 23:28 飞天大蟾蜍 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 编码过程: 首先对信号进行低通滤波 然后是lpc分析,并转成lsp量化(莱文森德宾递推公式) 判断是否为静音帧 感加强权,加强共振峰,以便得到的残差信号周期性更强 根据自相关来搜索基音周期 如果是静音帧,根据需要,生成sid报,舒适噪声生成 如果... 阅读全文
posted @ 2012-01-19 16:33 飞天大蟾蜍 阅读(29) 评论(0) 推荐(0) 编辑
摘要: 现在来分析最后一块g723中最后一个未分析模块 共振峰后置滤波器 涉及函数 Spf Scale 观察itu 3.8 式49.3: 10 1 - Σ ai * λ1^i * z^(-i) i=1 ... 阅读全文
posted @ 2012-01-19 15:52 飞天大蟾蜍 阅读(36) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 10 11 12 13 下一页