摘要:
1. 为什么介绍此文? Triplet net 改进工作之一,主要思想是在大数据集(人脸识别)上的困难样本挖掘。人脸识别工作对于图像对匹配而言很有借鉴意义,共性是特征的提取和样本数据的挖掘。 Tripnet net源于文章Deep metric learning using triplet netw 阅读全文
摘要:
数据增强在机器学习中的作用不言而喻。和图片分类的数据增强不同,训练目标检测模型的数据增强在对图像做处理时,还需要对图片中每个目标的坐标做相应的处理。此外,位移、裁剪等操作还有可能使得一些目标在处理后只有一小部分区域保留在原图中,这需要额外的机制来判断是否需要去掉该目标来训练模型。为此TensorLa 阅读全文
摘要:
本文译自2018CVPR Fast and Accurate Single Image Super-Resolution via Information Distillation Network 代码: github (in caffe) 特点:结构简洁、实时速度,更好精度 结果:state-of- 阅读全文
摘要:
本文译自2018CVPR DeepBack-Projection Networks For Super-Resolution 代码: github 特点:不同于feedback net,引入back projection net 结果:state of the art,尤其在大尺度上面,例如x8倍 阅读全文
摘要:
5月的最后一天,需要写点什么。 通过前几篇博客对Faster-RCNN算是有了一个比较全面的认识,接下来的半个月断断续续写了一些代码,基本上复现了论文。利用torchvision的VGG16预训练权重,在VOC02007trainval训练13个epoch,最后VOC2007test的map在0.6 阅读全文
摘要:
因为之前对比了RoI pooling的几种实现,发现python、pytorch的自带工具函数速度确实很慢,所以这里再对Faster-RCNN中另一个速度瓶颈NMS做一个简单对比试验。 这里做了四组对比试验,来简单验证不同方法对NMS速度的影响。 方法1:纯python语言实现:简介方便、速度慢 方 阅读全文
摘要:
Faster-RCNN论文中在RoI-Head网络中,将128个RoI区域对应的feature map进行截取,而后利用RoI pooling层输出7*7大小的feature map。在pytorch中可以利用: torch.nn.functional.adaptive_max_pool2d(inp 阅读全文
摘要:
总结自论文:Faster_RCNN,与Pytorch代码: 本文主要介绍代码最后部分:trainer.py 、train.py , 首先分析一些主要理论操作,然后在代码分析里详细介绍其具体实现。首先是训练与测试的过程图: 还是要再次强调: AnchorTargetCreator和ProposalTa 阅读全文
摘要:
总结自论文:Faster_RCNN,与Pytorch代码: 本文主要介绍代码第二部分:model/ , 首先分析一些主要理论操作,然后在代码分析里详细介绍其具体实现。 首先在参考文章的基础上进一步详细绘制了模型的流程图。在 上一篇博客中介绍了模型的上半部分,本文将对模型的下半部分做一介绍。 Fast 阅读全文