摘要:
Listen过程:将MFCC特征X输入encoder得到输出 h向量,每个x输出一个h。 encoder可以是:RNN、CNN、self-attention layers等 attention and spell过程 1. 向量z0与向量h进行attention运算产生数字α0 2. 使用softm 阅读全文
摘要:
GMM-HMM:给定MFCC特征X时,计算每一个状态产生x的概率p(x|a)、p(x|b)....,然后最大的概率就是其对应的状态 DNN-HMM:给定MFCC特征X时,直接计算x属于每一个状态的概率p(s|x),最大值就是对应的状态。 p(a)是训练集中每个状态出现的概率。 阅读全文
摘要:
GMM-HMM:包含3个状态,每个状态由一个GMM混合高斯分布(u,D,pi),每个混合高斯分布包含pi个高斯函数 单个因素的训练过程 trainging训练阶段: 1. 每个triphone三音子对应一个GMM-HMM。训练时先对齐 找到每个triphone(GMM-HMM)的音频特征MFCC序列 阅读全文