摘要: 序列模型和注意力机制 Seq2Seq模型 Seq2Seq(Sequence-to-Sequence)模型能够应用与机器翻译、语音识别等各种序列到序列的转换问题。一个Seq2Seq模型包括编码器(Encoder)和解码器(Decoder)两部分,它们通常是两个不同的RNN。如下图所示,将编码器的输出作 阅读全文
posted @ 2023-11-18 13:41 newbe3three 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 自然语言处理与词嵌入 词嵌入 one-hot向量表示了每个词在词汇表中的位置,但是每个one-hot向量的内积为0,不能表示出每个词之间的相互关系。 I want a glass of orange juice. I want a glass of apple __. 例如,对于上述的这样一句话,通 阅读全文
posted @ 2023-11-18 13:36 newbe3three 阅读(56) 评论(0) 推荐(0) 编辑
摘要: 循环序列模型 自然语言和音频都是前后相关联的数据,对于这些前后相关联的序列数据通过循环神经网络(Recurrent Neural Network, RNN)来进行处理。 使用RNN收i先的应用有下图所示的例子: 上图中所有的这些问题都可以通过有监督学习,通过输入给定的标签数据\((X,Y)\)作为训 阅读全文
posted @ 2023-11-18 13:25 newbe3three 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 特殊应用:人脸识别和神经风格转换 人脸识别 与人脸识别(Face Recognition)相关的还有活体检测(Liveness Detection)问题,在这里仅讨论前者。 人脸验证(Face Verification)和人脸识别(Face Recognition)的区别: 人脸验证:一般指一个1对 阅读全文
posted @ 2023-11-18 13:20 newbe3three 阅读(34) 评论(0) 推荐(0) 编辑
摘要: 目标检测 Object detection 目标检测的第一步是目标定位(Object localization)。对于图片分类器我们已经十分了解,而目标定位不仅需要判断图片中是否有某一类对象,还需要在图片中标记出它的位置。 如果图片中有多个对象,就需要识别出图片中所有的对象,并标记出来位置,也就是目 阅读全文
posted @ 2023-11-18 13:16 newbe3three 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 深度卷积模型:案例探究 为什么要学习一些案例呢? 就像通过看别人的代码来学习编程一样,通过学习卷积神经模型的案例,建立对卷积神经网络的(CNN)的“直觉”。并且可以把从案例中学习到的思想、模型移植到另外的任务上去,他们往往也表现得很好。 接下来要学习的神经网络: 经典模型:LeNet5、AlexNe 阅读全文
posted @ 2023-11-18 12:37 newbe3three 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 卷积神经网络 计算机视觉问题 计算机视觉(computer vision)是因深度学习而快速发展的领域之一,它存进了如自动驾驶、人脸识别等应用的发展,同时计算机视觉领域的发展还可以给其他领域提供思路。 计算机视觉应用的实例:图片分类(识别是不是一只猫)、目标检测(检测途中汽车行人等)、图片风格转移等 阅读全文
posted @ 2023-11-18 10:53 newbe3three 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 误差分析 Error Analysis 如果你的机器学习算法表现得还不够好,那么通过手工去检查算法所犯的错误,这个过程称为错误分析(Error Analysis)。 举例如下,团队开发的识别猫咪的分类器,在dev set上准确率为90%。此时我们希望提升算法的性能,通过分析算法的错误样本,发现其中有 阅读全文
posted @ 2023-11-18 00:07 newbe3three 阅读(80) 评论(0) 推荐(0) 编辑