08 2018 档案
摘要:整个特征预测网络是一个带有注意力机制(attention)的seq2seq网络。 编码器 解码器(Encoder Decoder)结构 在原始的编码器 解码器结构中,编码器(encoder)输入一个序列或句子,然后将其压缩到一个 固定长度 的向量(向量也可以理解为一种形式的序列)中;解码器(deco
阅读全文
摘要:数据增强(Data augmentation) 预处理(Pre processing) 初始化(Initializations) 训练中的Tricks 激活函数(Activation functions) 正则化(Regularizations) 画图洞察数据 集成学习(Ensemble) 数据增强
阅读全文
摘要:只要神经元足够,神经网络可以以任意精度逼近任意函数。为了拟合非线性函数,需要向神经网络中引入非线性变换,比如使用激活函数: $sigmoid(x)\sigma(x)\(,该函数可以将实数压缩到开
阅读全文
摘要:语音合成,又称文语转换(Text To Speech, TTS),是一种可以将任意输入文本转换成相应语音的技术。 传统的语音合成系统通常包括前端和后端两个模块。前端模块主要是对输入文本进行分析,提取后端模块所需要的语言学信息,对于中文合成系统而言,前端模块一般包含文本正则化、分词、词性预测、多音字消
阅读全文
摘要:前置知识 激励:信号处理中的输入 谐振:等同于 共振 ,不同领域的不同称谓。当电路中激励的频率等于电路的固有频率时,电路的电磁振荡的振幅也将达到峰值,这就称作 谐振 。参见 "谐振 百度百科" 白噪声:指功率谱密度在整个频域内均匀分布的噪声。参见 "白噪声 百度百科" 音素:phoneme,语音中最
阅读全文