【语音AI】VAD简介
简介
百度百科搜的解释(维基百科被墙了)
语音活动检测(Voice Activity Detection,VAD)又称语音端点检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用,它是IP电话应用的重要组成部分。静音抑制可以节省宝贵的带宽资源,可以有利于减少用户感觉到的端到端的时延。
为什么引入VAD
在简介中能看出来vad检测是为了节省带宽资源,有利于减少用户感觉到的端到端的时延。
真实情况下,在设计语音相关模块的测试时,都和vad紧密相关。引入vad处理拾音进来的音频,一方面能更加准确区别静音状态和有声状态,另一方面也能降低功耗问题,送入处理的音频,只需要是非静音的音频就可以了。
----保持谦虚保持清醒