摘要: Listen过程:将MFCC特征X输入encoder得到输出 h向量,每个x输出一个h。 encoder可以是:RNN、CNN、self-attention layers等 attention and spell过程 1. 向量z0与向量h进行attention运算产生数字α0 2. 使用softm 阅读全文
posted @ 2023-05-29 16:24 wieneralan 阅读(74) 评论(0) 推荐(0) 编辑
摘要: GMM-HMM:给定MFCC特征X时,计算每一个状态产生x的概率p(x|a)、p(x|b)....,然后最大的概率就是其对应的状态 DNN-HMM:给定MFCC特征X时,直接计算x属于每一个状态的概率p(s|x),最大值就是对应的状态。 p(a)是训练集中每个状态出现的概率。 阅读全文
posted @ 2023-05-29 14:40 wieneralan 阅读(282) 评论(0) 推荐(0) 编辑
摘要: GMM-HMM:包含3个状态,每个状态由一个GMM混合高斯分布(u,D,pi),每个混合高斯分布包含pi个高斯函数 单个因素的训练过程 trainging训练阶段: 1. 每个triphone三音子对应一个GMM-HMM。训练时先对齐 找到每个triphone(GMM-HMM)的音频特征MFCC序列 阅读全文
posted @ 2023-05-29 10:41 wieneralan 阅读(572) 评论(0) 推荐(0) 编辑
摘要: sherpa-ncnn 和 sherpa-onnx 目前只支持 transducer 模型;而sherpa 同时支持 transducer 和 CTC 模型 阅读全文
posted @ 2023-05-25 17:26 wieneralan 阅读(770) 评论(0) 推荐(0) 编辑
摘要: Reworked Conformer模型代码: https://github.com/k2-fsa/icefall/blob/master/egs/librispeech/ASR/pruned_transducer_stateless2/ Reworked Conformer模型说明 https:/ 阅读全文
posted @ 2023-05-25 09:56 wieneralan 阅读(137) 评论(0) 推荐(0) 编辑
摘要: RNN-T 模型最后一层的输出是一个 4-D 的 tensor,维度是 (N, T, U, C), 其中 N: batch size。数值大小: 一般是几十 T: encoder 的输出帧数。数值大小:一般是好几百。 这里T 可理解为输入的feature帧数,实际可能是做了降采样后的帧数T U: d 阅读全文
posted @ 2023-05-25 09:52 wieneralan 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 介绍端到端模型的几种语言模型结合方式,shallow fusion, Density Ratio, Low-order Density Ratio(LODR),ILME(Internal Language Model Estimation)方法等,详见 https://mp.weixin.qq.co 阅读全文
posted @ 2023-05-24 15:18 wieneralan 阅读(191) 评论(0) 推荐(0) 编辑
摘要: test.py内容如下: 第一行添加 #!/your_python_path #!/usr/bin/python print('test execute python') chmod u+x test.py (给test.py增加执行权限) 即可使用./test.py运行python程序 阅读全文
posted @ 2023-05-24 09:41 wieneralan 阅读(30) 评论(0) 推荐(0) 编辑
摘要: test.sh 方式一要求test.sh必须有可执行权限,方式二、三、四 有没有可执行权限都可以 方式一:./test.sh ./(点斜杠)的意思是执行当前目录下的某个可执行文件, 此方式文件必须是可执行文件, 如果没有 chmod u+x filename 可赋予文件执行权限。 启动另一个Shel 阅读全文
posted @ 2023-05-23 17:18 wieneralan 阅读(1384) 评论(0) 推荐(0) 编辑
摘要: 全局变量对所有shell包括子shell都是可见的。局部变量在当前shell中可见,子shell中设置的局部变量,回到父shell中就不可见了。 全局变量的创建:先建一个局部变量,通过export命令完成全局化。(变量名、等号、值之间没有空格) my_var="i am global" export 阅读全文
posted @ 2023-05-12 10:00 wieneralan 阅读(24) 评论(0) 推荐(0) 编辑