摘要:
文章目录 1. Batch Normalization2. High Resolution Classifier3. Anchor、Dimension Cluster、Direct location prediction4. Loss Function5. Fine-Grained Features 阅读全文
摘要:
文章目录 1. 作者简介2. 目标检测综述3. YOLOv1算法3.1 预测阶段3.2 预测阶段后处理3.3 训练阶段 YOLO的全称是you only look once,指只需要浏览一次就可以识别出图中的物体的类别和位置。 YOLO是目标检测模型。目标检测是计算机视觉中比较简单的任务,用来在一张 阅读全文
摘要:
文章目录 1. 简介2. 多头注意力3. 有掩码的多头注意力4. 基于位置的前馈网络5. 层归一化6. 信息传递7. 预测 1. 简介 基于编码器-解码器架构来处理序列对跟使用注意力的seq2seq不同,Transformer是纯基于注意力 2. 多头注意力 对同一key,value,query,希 阅读全文
摘要:
文章目录 1. 简介2. 非参数化注意力池化层3. 参数化的注意力机制4. 注意力分数5. 自注意力和位置编码 1. 简介 心理学 动物需要在复杂环境下有效关注值得注意的点心理学框架:人类根据随意(有意识)线索和不随意(无意识)线索选择注意点 注意力机制是一种在深度学习领域中的重要技术,尤其在自然语 阅读全文
摘要:
循环神经网络(Rerrent Neural Network,RNN)是神经网络的一种,类似的还有深度神经网络(DNN)、卷积神经网路(CNN)、生成对抗网络(GAN)等。**RNN对具有时序特性的数据非常有成效,他能挖掘数据中的时序信息以及语义信息。**利用RNN的这种能力,使深度学习模型在解决语音 阅读全文
摘要:
自然语言处理的输入输出基本上都是序列,序列问题是自然语言处理最本质的问题。 序列模型:就是输入输出均为序列数据的模型,序列模型将输入序列数据转换为目标序列数据。 序列数据 实际上很多数据是有时序结构的 电影的评价随时间变化而变化 拿奖后评分上升,直到奖项被忘记看了很多好电影后,人们的期望变高季节性: 阅读全文
摘要:
文章目录 1. 评价指标2. 计算示例3. COCO评价指标 1. 评价指标 在目标检测领域,比较常用的两个公开数据集:pascal voc和coco。 目标检测与图像分类明显差距是很大的,在图像分类中,我们通常是统计在验证集当中,分类正确的个数除以验证集的总样本数就能得到准确率。 那么对于目标检测 阅读全文
摘要:
所谓风格迁移,其实就是提供一幅画(Reference style image),将任意一张照片转化成这个风格,并尽量保留原照的内容(Content)。 将样式图片中的样式迁移到内容图片上,得到合成图片。 基于CNN的样式迁移 奠基性工作: 首先,我们初始化合成图像,例如将其初始化为内容图像。 该合成 阅读全文
摘要:
FCN(全卷积神经网络)图像语义分割的一种框架,是深度学习用于语义分割领域的开山之作。FCN将传统CNN后面的全连接层换成了卷积层,这样网络的输出将是热力图而非类别;同时,为解决卷积和池化导致图像尺寸的变小,使用上采样方式对图像尺寸进行恢复。 FCN网络的特点: 不含全连接层的全卷积网络,可适应任意 阅读全文
摘要:
卷积不会增大输入的高宽,通常要么不变、要么减半转置卷积则可以用来增大输入高宽 为什么称之为“转置”呢? 对于卷积 Y = X ✭ W Y=X✭W Y=X✭W 可以对 W W W构造一个 V V V,使得卷积等价于矩阵乘法 Y ′ = V X ′ Y'=VX' Y′=VX′这里 Y ′ , X ′ Y 阅读全文