摘要:
定义模型两种方法: 训练神经网络模型: 【1】定义问题、收集数据集 处理二分类、多分类问题小tips (1)二分类:神经网络中间层可以使用带有relu激活的Dense堆叠,网络的最后一层是只有一个单元并使用sigmoid激活的Dense层,网络输出应该是0-1范围内的标量, 表示概率值。 (2)多分 阅读全文
摘要:
问题描述:样本为所有恐龙名字,为了构建字符级语言模型来生成新的名称,你的模型将学习不同的名称模式,并随机生成新的名字。 在这里你将学习到: 如何存储文本数据以便使用rnn进行处理。 如何合成数据,通过每次采样预测,并将其传递给下一个rnn单元。 如何构建字符级文本生成循环神经网络。 为什么梯度修剪很 阅读全文
只有注册用户登录后才能阅读该文。 阅读全文
摘要:
相同点: 两者所要实现的功能是一致的(将多维数组降位一维)。这点从两个单词的意也可以看出来,ravel(散开,解开),flatten(变平)。 不同点: 两者的区别在于返回拷贝(copy)还是返回视图(view) numpy.flatten()返回一份拷贝,对拷贝所做的修改不会影响(reflects 阅读全文
摘要:
1.基础模型basic model 以翻译为例,将如下一句法文翻译成英文,输入是法文的每个单词,输出是英文的每个单词,分别用$x^{},y^{}$表示: 如何构建一个模型,使得输入法文序列的词,输出英文序列的词呢?接下去要介绍的知识与思想主要来自于这两篇论文: (1)首先建立一个网络,称之为 enc 阅读全文
摘要:
1.词汇表征 1.1 one hot词编码的缺陷 回顾上一节的词向量表示方式:one hot编码。即根据拥有的尽可能多的语料,整理一份词典,词典长度为n,使得每个词对应一个n 1的词向量,其中该词索引所在的位置为1,其余位置为0. 比如,如下图,woman这个词在索引为9853的位置上是1,其余位置 阅读全文
摘要:
一. why sequence models? (1)序列模型广泛应用于语音识别,音乐生成,情感分析,DNA序列分析,机器翻译,视频行为识别,命名实体识别等众多领域。 (2)上面那些问题可以看成使用(x,y)作为训练集的监督学习,但是输入与输出的对应关系有非常多的组合, 比如一对一,多对多,一对多, 阅读全文
摘要:
1. What is face recognition 首先简单介绍一下人脸验证(face verification)和人脸识别(face recognition)的区别。 人脸验证 :输入一张人脸图片,验证输出与模板是否为同一人,即一对一问题。 人脸识别 :输入一张人脸图片,验证输出是否为K个模板 阅读全文
摘要:
本章介绍目标定位和目标检测(包含多目标检测)。 1. Object Localization 原始图片经过CONV卷积层后,Softmax层输出4 x 1向量,分别是: 注意,class label也可能是概率。上述四个向量分别对应pedestrain,car,motorcycle和backgrou 阅读全文
摘要:
1. Classic networks (1)LeNet 5 该LeNet模型总共包含了大约6万个参数。当时Yann LeCun提出的LeNet 5模型池化层使用的是average pool,而且各层激活函数一般是Sigmoid或tanh。现在,一般池化层使用Max pool,激活函数用ReLU。 阅读全文