摘要:
一.提出背景 Transformer最早是Google在2017年的Attention Is All You Need论文中提出,用于解决解决传统的序列到序列(Seq2Seq)模型在处理可变长序列时遇到的问题。(序列到序列:指的是模型的输入是一段序列,模型输出也是序列;比如语音识别中给模型一段中文语 阅读全文
摘要:
一.原理 (为什么使用one-hot编码来处理离散型特征? 在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。而我们使用one-hot编码,将离散特征的取值扩展到了欧式空间, 阅读全文
摘要:
一.维度情感模型 人类的情感是复杂繁琐的认知过程,很难对人类情感进行简单的概括,现阶段的情感模型大多分为两种,分别是离散情感模型和维度情感模型。 传统上,情感被看作是离散的类别,例如快乐、悲伤、愤怒等。离散情感模型将情感分为独立的类别,著名的心理学家Ekman等人总结了六种基本情绪:快乐、悲伤、愤怒 阅读全文
摘要:
1.定义: 泛化能力是指模型在新数据(即测试集或真实世界数据)上预测准确性的能力,这些数据与模型在训练过程中使用的数据不同。 过拟合(Overfitting)是指模型在训练数据上表现得很好,但在新数据上表现差,这表明模型缺乏泛化能力。 一个具有良好泛化能力的模型能够很好地适应新情况,而不仅仅是记住训 阅读全文
摘要:
在机器学习和深度学习中,将数据分为训练集(Training Set)、验证集(Validation Set)和测试集(Test Set)是常见的做法,每部分数据承担不同的任务: 一.基本概念 1.训练集(Training Set): 训练集用于训练模型,即通过算法调整模型的参数以最小化损失函数(Lo 阅读全文