【语音AI】VAD简介

简介
百度百科搜的解释(维基百科被墙了)
语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用,它是IP电话应用的重要组成部分。静音抑制可以节省宝贵的带宽资源,可以有利于减少用户感觉到的端到端的时延。

为什么引入VAD

在简介中能看出来vad检测是为了节省带宽资源,有利于减少用户感觉到的端到端的时延。

真实情况下,在设计语音相关模块的测试时,都和vad紧密相关。引入vad处理拾音进来的音频,一方面能更加准确区别静音状态和有声状态,另一方面也能降低功耗问题,送入处理的音频,只需要是非静音的音频就可以了。

 

 
 
 
posted @ 2021-04-12 10:54  钰蛋  阅读(1103)  评论(0编辑  收藏  举报