该文被密码保护。 阅读全文
摘要:
http://www.doc88.com/p-6781563333826.html 立体声 虚拟环绕声 空间感 包围感 声像定位 应用 http://www.doc88.com/p-746875102309.html 声像展宽原理 混响 matlab滤波器设计 matlab录音及显示 阅读全文
摘要:
1.voice unvoice 归一化自相关函数 config.cutOffFreq = 900; [LowPass] = LowPassFilter(WaveIn, fs, config.cutOffFreq); cc = CenterClipping(x, 0.3); AutoCorr = xc 阅读全文
该文被密码保护。 阅读全文
摘要:
今年音频没事干了,根据业务需求,调研音视频p2p通信,减小服务器压力,一切从0开始。 需要信令服务器,打洞服务器,帮助链接打通双方,实现p2p音视频通信。 服务器和客服端交互等都需要实现。 谷歌webrtc里面有个安卓的demo apprtc: WebRTCDemo可以直接做成P2P的效果,AppR 阅读全文
摘要:
前段时间意外收到MS的电面,因为现在做的工作基本上是与音频、音乐信号处理相关,外带互联网全能打杂型。本质上跟计算机纯软件不是太相关。我最后选择了自己比较感兴趣的IMML组面试了一下。 面试基本上就是英语口语面试和二叉树相关的内容。所以想进微软的同学,这两项基本功要打好基础了。 笔试的第一... 阅读全文
摘要:
音量较小时,自适应放大。agc处理后:音量较大时,自适应放小。agc处理后: 阅读全文
摘要:
https://en.wikipedia.org/wiki/Wiener_filterWiener filter solutionsThe Wiener filter problem has solutions for three possible cases: one where a noncau... 阅读全文
摘要:
提取出频谱特征,然后使用gmm、svm、dnn模型进行训练和分类,实时话语检测。原始文件VAD处理,剔除静音后的效果: 阅读全文
摘要:
这段时间终于把手头的东西都搞完了,还剩下一个AEC这个模块,这个模块跟整个系统机制有很大关系,单独的模块意义不大。另外,刚写完一个分类器,希望能大幅提升音乐流派分类的准确率。下周正式开搞AEC,把之前做的一些事情记录一下。https://en.wikipedia.org/wiki/Dynamic_r... 阅读全文
摘要:
soundtouch变速算法很类似sola算法,细看才知道是wsola算法。上个星期有个需求,将该变速应用到直播的包处理,有点类似于webrtc的netEQ处理机制。直接使用soundtouch,会存在一些问题:1.一段正常,一段变速,中间会出现不连续,有冲击。或者不同速率的切换。 越频繁,现象更明... 阅读全文
摘要:
以前一直都是针对整个文件的音效处理。为了将变调不变速、变速变调、变速不变调的功能 整理到PC demo里面,实时产生效果。只好重新将整个数据流产生流程和获取流程整理了一下,生成一个多线程单例模式的音效处理对象,终于OK搞定了。在播放的过程中,可以随时调整两种音效的系数,实时产生效果。下一次有时间,把... 阅读全文
摘要:
音频分析中,MFCC参数是经典参数之一。之前对于它的计算流程和原理,大体上是比较清楚的,所以仿真的时候,都是直接调用matlab的voicebox工具或者开发的时候直接调用第三方库。最近想整理一个纯C语言版本的MFCC函数,发现第三方开源的一部分是C++的,有些纯C的开源代码是针对语音固定了... 阅读全文
摘要:
参考《A Highly Robust Audio Fingerprinting System》 Philips 音频指纹提取流程: 仿真效果: 第一个图为歌曲1的第一个指纹。 第二个图为歌曲1压缩为192kbps的第一个指纹。 第三个图为歌曲2的第一个指纹。 第四个图为,图1和图2的指纹差。 第五个 阅读全文
摘要:
Time stretchingis the process of changing the speed or duration of anaudio signalwithout affecting itspitch.Pitch scalingorpitch shiftingis the opposi... 阅读全文
摘要:
A harmonic sound is said to have a missing fundamental, suppressed fundamental, orphantom fundamental when its overtones suggest a fundamental frequen 阅读全文
摘要:
这里有篇论文《基于子带谱平滑度的音频篡改检测》,可供参考。这里的质量主要涉及到采样率,即低采样率伪装高采样率音频。大部分假无损就是上采样为高质量的音频,然后用无损格式封装。11025Hz 伪装重采样 22050Hz音频,重采样不会补充有用信息,即11025/2 ~ 22050/2仍然平坦。22050... 阅读全文
摘要:
根据对双门限的理解和修改,重写了一个离线版端点检测。function [st,en]=VAD(x, fs)x=double(x);x=x/max(abs(x));framelen= floor(fs*40/1000);%frameinc= floor(fs*10/1000);%y=enframe(... 阅读全文
摘要:
部分文献的结果:印度古典乐的几种简单乐器的演奏,谱减法消去部分背景音初步处理,区分结果:前提已知-音乐的曲调,消去部分背景音,实验结果:针对各类复杂的流行音乐,自己实验的结果:1120首10折交叉验证的准确率是87.2%5000首10折交叉验证的准确率是86.40% 耗时 15个小时截取中间3分钟5... 阅读全文
摘要:
未来还有进一步提升的空间,测试结果只能说明部分问题1.原始结果Correctly Classified Instances 762 76.2%Incorrectly Classified Instances 238 23.8% a b c d e f g h i j <-- cl... 阅读全文