随笔分类 - 阅读笔记
摘要:YOLOv2: YOLOv1的缺点 虽然检测速度较快,可以实现实时检测,但mAP(检测准确度)较之前的双阶段目标检测模型较低 图像划分为7x7个grid cell,每个grid cell负责预测一个物体,最多预测49个物体,召回率较低 检测小目标和密集目标的能力比较差 YOLOv2 Better B
阅读全文
摘要:论文阅读(8)YOLOv1:You Only Look Once: Unified, Real-Time Object Detection 预测阶段 特征提取 图像卷积(卷积神经网路)之后生成7x7x30张量 将输入图片划分成7x7的网格(grad cell),每一个网格预测2个定位框(x,y,h,
阅读全文
摘要:arXiv:1506.01497 参考: FasterRCNN_哔哩哔哩_bilibili 初读 目前已经了解了目标检测最基础的3个算法:R-CNN、SSPNet和Fast R-CNN,后两者都是基于R-CNN的优化,所以说R-CNN是深度学习目标检测的开山之作。 R-CNN存在不足之处,1张图片使
阅读全文
摘要:arxiv:1504.08083 参考 FastRCNN_哔哩哔哩_bilibili 44 物体检测算法:R-CNN,SSD,YOLO【动手学深度学习v2】_哔哩哔哩_bilibili 初读 R-CNN首次提出将CNN应用于目标检测领域,SPPNet提出SPP layer,提升了R-CNN的速度。但
阅读全文
摘要:arxiv:1406.4729 初读 传统CNN要求固定输入图片的大小,因此若输入图片不符合要求,需要对输入的图片进行大小变换,包括剪裁和长宽变形,这样的处理有可能会使得模型的性能下降。提出空间金字塔池化层(spatial pyramid polling),可以实现直接输入任意大小图片,通过SPP输
阅读全文
摘要:阅读论文(3)R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation 参考: R-CNN算法精讲 - 同济子豪兄 -_哔哩哔哩_bilibili 1.1Faster RCNN理论合集
阅读全文
摘要:arXiv:1409.1556 参考: https://www.bilibili.com/video/BV1Ao4y117Pd/?spm_id_from=333.999.0.0 4.2 使用pytorch搭建VGG网络_哔哩哔哩_bilibili VGG模型 VGG结构共有5个VGG块,主要模型为V
阅读全文
摘要:[toc] * 提出ResNet模型,深度残差神经网络模型。 * 论文发表于2015年,2016年CVPR最佳论文 * 作者何恺明、孙剑、张翔宇、任少卿(微软亚洲研究院) 参考: [ResNet为什么能解决网络退化问题 - 同济子豪兄 - bilibili](https://www.bilibili
阅读全文
摘要:Alexnet卷积神经网络模型 重叠池化(overlapping pooling) 传统不重叠的池化层,步长s与窗口尺寸z是相同的,s = z。而重叠池化步长s小于窗口尺寸z,s < z。 局部响应归一化 参考:https://zhuanlan.zhihu.com/p/434773836 https
阅读全文