摘要: 音频处理库性能对比:计算mel频谱的速度哪个更快? 介绍 音频信号处理在各种应用中都发挥着重要的作用,如语音识别、音乐信息检索、语音合成等。其中,Mel频谱是一种常用的频域特征表示方法,用于描述人类听觉系统对频率的敏感程度。 在深度学习音频领域,mel频谱是最常用的音频特征。在本文中,我们将对四个常用的音频处理库——audioflux、torchau 阅读全文
posted @ 2023-04-25 14:52 audioFluxLab 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 疫情期间在校花了几个月时间,写了这个小项目,是关于音频特征提取和分析的,自己是 AI 专业研究音频的,但受限于对音频特征的理解,做研究时总感觉缺乏“底料”,所以当做是学习练手做了这个小东西。 因为是学习练手的小项目,放 github 上面后就没有太多跟进了,后来看到国内几个有名的 github 项目 阅读全文
posted @ 2023-04-11 07:08 audioFluxLab 阅读(100) 评论(0) 推荐(0) 编辑
摘要: (目录) audioFlux是一个Python和C实现的库,提供音频领域系统、全面、多维度的特征提取与组合,结合各种深度学习网络模型,进行音频领域的业务研发,下面从时频变换、频谱重排、倒谱系数、解卷积、谱特征、音乐信息检索六个方面简单阐述其相关功能。 项目地址: https://github.com 阅读全文
posted @ 2023-04-10 11:13 audioFluxLab 阅读(598) 评论(0) 推荐(2) 编辑