2022 年 11月随笔档案 - Uriel-w

WeNet中注意力重打分（attention rescoring decoding）

摘要：我们知道CTC是非自回归，而像transformer中解码是自回归的，所以transformer很大的一个缺陷就是解码速度慢。在最近几年CTC和注意力机制联合训练得到的性能效果得到极大的提升，在训练过程中主要的操作就是将encoder的输出分别作为decoder的输入和CTC的输入，通过两种不同

788

0

WeNet和ESPnet中下采样模块（Conv2dSubsampling）

摘要：关于WeNet和ESPnet两个工具下采样模块都是相同的操作，首先将输入序列扩充一个维度（因为要使用二维卷积），然后通过两个二维卷积，其中第一个卷积的输入通道为“1”，输出通道为odim（ESPnet中默认为256，WeNet默认为512），卷积核大小为3x3。第二个卷积输入通道是odim，输

318

0

ipdb在debug中常用命令

摘要：下载安装ipdb： pip install ipdb ipdb的使用：方法一：在终端使用ipdb调试代码时，加入断点仅需要import ipdb，然后在任意行插入ipdb.set_trace()即可，在执行文件时当遇到断点进入debug模式。方法二：通过命令调试代码： python -m ipd

400

0

nn.Embedding 的理解

摘要：Embedding是将输入向量化，参数包括： nn.Embedding(vocab_size, emb_size) vocab_size：词典大小（不是每个batch size的长度，而是数据集词库的大小）emb_size：每个词需要嵌入多少维来表示（也就是输入维度）构造一个(假装)vocab si

1399

0

1

数据降噪处理--python实现

摘要：原文链接：https://blog.csdn.net/qq_38342510/article/details/121227880 一、均值滤波 1）算法思想给定均值滤波窗口长度，对窗口内数据求均值，作为窗口中心点的数据的值，之后窗口向后滑动1，相邻窗口之间有重叠；边界值不做处理，即两端wid_le

407

0

标签平滑的作用以及实现过程

摘要：原文链接：https://blog.csdn.net/qq_44015059/article/details/109479164

27

0

Uriel-w

11 2022 档案

公告