摘要: 简称SD,顾名思义,在采集的语音信号流中,分辨出不同说话人的说话时长并标注,即以时间为索引,检测出每段语音所对应的说话人身份,其通常由说话人分割和聚类两步组成。 参照2010年8月的文献[1]中的一张图: 又称说话人分割等,在语音信号处理的多种场景下均有应用需求,近年来也被多来越多的研究者所关注。S 阅读全文
posted @ 2020-01-04 18:45 Skye_Zhao 阅读(7222) 评论(0) 推荐(0) 编辑