音频技术——分帧

分帧是音频处理中最常见的技术，音频之所以要分帧是因为音频是一个长时间非稳态的序列

为了让不稳定的音频可以得到一个相对稳定的特征参数，我们常常进行一些分帧操作

分帧的目的是让非稳态的音频在短时处于一个稳态的状态，也就是平常常说的语音信号的短时分析技术

在短时分析中，将语音信息分为一段一段来分析，每一段称之为一帧，一帧一般取10~30ms

这样子，就从一个时域长信号的问题，变成了时域分段稳定信号的分析过程

音频的分帧常用于时域，频域。其中时域特征是经常使用的一种方式

如果以一段音频的长度为 y ，设置帧长和帧移，那么我们就可以计算

这段音频的帧数 frame_num = (N -win +inc)/inc = (N - overloop)/inc = (N - win)/inc+1

其中各类数据的定义如下 frame_num 为音频的帧数 N为音频的采样点数采样点数= 采样率*音频时长 win为窗口长度 inc为帧移 overloop=win-inc

posted @ 2022-12-01 20:06 qcj1206 阅读(1168) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 音频技术——librosa常见使用方法

· 语音处理加窗分帧

· 声纹-音频信号处理基础

· 常见音频编码格式（转）

昵称： qcj1206
园龄： 2年3个月
粉丝： 0
关注： 1

2025年3月

日

一

二

三

四

五

六