摘要:
两者都可以用来衡量两个概率分布之间的差异性。JS散度是KL散度的一种变体形式。 KL散度:也称相对熵、KL距离。对于两个概率分布P和Q之间的差异性(也可以简单理解成相似性),二者越相似,KL散度越小。 KL散度的性质:●非负性。即KL散度大于等于零。 ●非对称性。即运算时交换P和Q的位置,得到的结果 阅读全文
摘要:
RNN循环神经网络 RNN循环神经网络被广泛应用于自然语言处理中,对于处理序列数据有很好的效果,常见的序列数据有文本、语音等,至于为什么要用到循环神经网络而不是传统的神经网络,我们在这里举一个例子。 假如有一个智能订票系统,我只需要输入一句话,该系统能识别出我将在什么时间订购去哪里的车票。那么程序需 阅读全文
摘要:
Transformer是一个利用注意力机制来提高模型训练速度的模型。关于注意力机制可以参看这篇文章,trasnformer可以说是完全基于自注意力机制的一个深度学习模型,因为它适用于并行化计算,和它本身模型的复杂程度导致它在精度和性能上都要高于之前流行的RNN循环神经网络。 那什么是transfor 阅读全文
摘要:
TF-slim 模块是TensorFLow中比较实用的API之一,是一个用于模型构建、训练、评估复杂模型的轻量化库。 其中引入的比较实用的函数包含arg_scope、model_variables、repeat、stack。 slim 模块是在16年推出的,其主要功能是为了实现"代码瘦身"。 该模块 阅读全文
摘要:
paper:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Tensorflow-faster r-cnn github:Tensorflow Faster RCNN for Object 阅读全文
摘要:
RCNN存在的问题: 1、一张图像上有大量的重叠框,所以这些候选框送入神经网络时候,提取特征会有冗余! 2、训练的空间需求大。因为RCNN中,独立的分类器和回归器需要很多的特征作为训练。RCNN中提取候选框,提取特征和分类回归是分开的,可独立。 Fast RCNN 针对上诉问题: Q1:将整张图片归 阅读全文
摘要:
目标检测architecture通常可以分为两个阶段: (1)region proposal:给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of 阅读全文
摘要:
SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》。在此之前,所有的神经网络都是需要输入固定尺寸的图片,比如224*224(ImageNet 阅读全文
摘要:
基于region proposal的RCNN系列:RCNN、Fast RCNN、Faster RCNN 基于区域划分的YOLO、SSD 基于强化学习的AttentionNet等,还有最新的Mask RCNN。 我们将用一周时间先详细介绍每个模型然后通过Tensorflow跑一遍模型。 说到基于reg 阅读全文
摘要:
先介绍几个物体检测的相关知识 不同于分类问题,物体检测可能会存在多个检测目标,这不仅需要我们判别出各个物体的类别,而且还要准确定位出物体的位置 下面图片上有猫,有狗,还有小黄鸭,这是多物体检测: 1.png 物体检测算法常用到的概念 下面我们讲解一下在物体检测算法中常用到的几个概念:Bbox,IoU 阅读全文