faster rcnn - 随笔分类 - 有梦就要去实现他

faster-rcnn anchor_target_layer、rpn_proposal_layer、proposal_target_layer

摘要：faster rcnn中这三层是单独生成的层,也是复现最复杂的层 anchor_target_layer作用:从众多的anchor中选取出正负样本供rpn网络学习(实际上就是把anchor和gt进行配对,配对后将这一对送给loss进行训练). 注意的点:从众多的anchor中随机选取128个正样本( 阅读全文

posted @ 2018-08-13 22:47 有梦就要去实现他阅读(774) 评论(0) 推荐(0)

faster rcnn细节总结

摘要：1.roi_pooling层是先利用spatial_scale将region proposal映射到feature map上，然后利用pooled_w、pooled_h分别将映射后的框的长度、宽度等分形成bin，最后对每个bin进行max_pooling，这其实就是一个spp-net的过程（只不过s 阅读全文

posted @ 2018-01-23 19:33 有梦就要去实现他阅读(419) 评论(0) 推荐(0)

rpn网络结构再分析

摘要：这是rpn网络train阶段的网络结构图 rpn_conv1之前的网络是特征提取层，也是和fast rcnn共享的层。rpn_conv1是一层1*1的卷积，这一层是单独为rpn网络多提取一层特征，这一层之后就接两个输出channel层不同的1*1的卷积（即分别进行score的预测和坐标补偿值的预测）阅读全文

posted @ 2018-01-21 23:16 有梦就要去实现他阅读(2078) 评论(0) 推荐(0)

虚检、漏检

摘要：阅读全文

posted @ 2018-01-18 15:24 有梦就要去实现他阅读(678) 评论(0) 推荐(0)

faster rcnn需要理解的地方

摘要：http://blog.csdn.net/terrenceyuu/article/details/76228317 https://www.cnblogs.com/houkai/p/6824455.html http://lib.csdn.net/article/computervison/6782 阅读全文

posted @ 2018-01-14 16:00 有梦就要去实现他阅读(151) 评论(0) 推荐(0)

proposal_layer.py层解读

摘要：proposal_layer层是利用训练好的rpn网络来生成region proposal供fast rcnn使用。 proposal_layer整个处理过程：1.生成所有的anchor，对anchor进行4个坐标变换生成新的坐标变成proposals（按照老方法先在最后一层feature map的阅读全文

posted @ 2017-10-14 22:12 有梦就要去实现他阅读(2522) 评论(0) 推荐(0)

faster rcnn一些博客

摘要：这个是对faster 问题的一个总结 http://blog.csdn.net/u010402786/article/details/72675831?locationNum=11&fps=1 这个代码应该是生成适合数据集的anchor的代码，但我没怎么看，之后可以看看： https://githu 阅读全文

posted @ 2017-10-08 15:58 有梦就要去实现他阅读(184) 评论(0) 推荐(0)

anchor_target_layer中的bounding regression

摘要：在anchor_target层，这两行是计算bounding regression代码：以下是bounding regression的计算公式： argmax_overlaps是每个anchor对应最大overlap的gt_boxes的下标，所以bbox_targets存储的是anchor和最大o 阅读全文

posted @ 2017-09-27 20:47 有梦就要去实现他阅读(506) 评论(0) 推荐(0)

faster rcnn结构

摘要：rpn-data层输入的是data即整张图片，然后是根据映射生成roi框 rpn-loss-bbox输入的才是整个网络预测的roi框 bbox_transform在rpn-data层使用，把生成的achor，并不是把预测的roi框回归 rpn_loss_bbox，论文中定义输入是ti和ti*，ti和阅读全文

posted @ 2017-09-27 16:09 有梦就要去实现他阅读(244) 评论(0) 推荐(0)

anchor_target_layer层其他部分解读

摘要：这部分代码是把所有anchor中超过了图片边界部分的anchor去掉，即论文中说的cross-boundary anchors 这部分代码是把和gt-roi有最大iou的anchor和与任何gt-roi iou大于0.7的anchor的label置为1，即前景。这和论文中所说的是一样的。把和所有g 阅读全文

posted @ 2017-09-27 15:07 有梦就要去实现他阅读(2532) 评论(0) 推荐(0)

anchor_target_layer层解读

摘要：总结下来，用generate_anchors产生多种坐标变换，这种坐标变换由scale和ratio来，相当于提前计算好。anchor_target_layer先计算的是从feature map映射到原图的中点坐标，然后根据多种坐标变换生成不同的框。 anchor_target_layer层是产生在r 阅读全文

posted @ 2017-09-26 16:16 有梦就要去实现他阅读(2444) 评论(0) 推荐(0)

在CNN网络中roi从原图映射到feature map中的计算方法

摘要：在使用fast rcnn以及faster rcnn做检测任务的时候，涉及到从图像的roi区域到feature map中roi的映射，然后再进行roi_pooling之类的操作。比如图像的大小是（600,800），在经过一系列的卷积以及pooling操作之后在某一个层中得到的feature map大小阅读全文

posted @ 2017-09-25 16:36 有梦就要去实现他阅读(1990) 评论(0) 推荐(0)

把特征网络换成resnet-50

摘要：从RFCN来看，Resnet-50和Resnet-101到最后一层卷积都是缩小到原来尺寸的16分之一，并且都用的7x7的格子去roi pooling。看paper可以知道：resnet-50核心是由3个conv2_x（3个卷积层），4个conv3_x（3个卷积层），6个conv4_x（3个卷积层）阅读全文

posted @ 2017-09-24 13:54 有梦就要去实现他阅读(4571) 评论(0) 推荐(0)

制作JPEGImages出现的bug

摘要：我用的是下面这个脚本进行改名字：但制作出来的图片顺序和原顺序不一样：原因在于os.walk读取目录的文件不是按顺序的，或者说按某种顺序但我不知道，至少没有按照文件夹本来的文件顺序返回利用all_image_index这个文件来实现不改变顺序的同时修改了文件的名字阅读全文

posted @ 2017-09-21 22:13 有梦就要去实现他阅读(321) 评论(0) 推荐(0)

这就是那个feature map256 256向量

摘要：http://blog.csdn.net/XZZPPP/article/details/51582810 在这个特征图上使用3*3的卷积核（滑动窗口）与特征图进行卷积，那么这个3*3的区域卷积后可以获得一个256维的特征向量。因为这个3*3的区域上，每一个特征图上得到一个1维向量，256个特性图即可阅读全文

posted @ 2017-09-16 19:52 有梦就要去实现他阅读(300) 评论(0) 推荐(0)

对faster rcnn代码讲解的很好的一个

摘要：http://www.cnblogs.com/houkai/p/6824455.html http://blog.csdn.net/u014696921/article/details/60321425 阅读全文

posted @ 2017-09-16 17:20 有梦就要去实现他阅读(452) 评论(0) 推荐(0)

input_shape { dim: 1 dim: 3 dim: 224 dim: 224 }

摘要：http://blog.csdn.net/u010417185/article/details/52619593 阅读全文

posted @ 2017-09-16 17:06 有梦就要去实现他阅读(360) 评论(0) 推荐(0)

faster rcnn的改进方向

摘要：http://blog.csdn.net/linolzhang/article/details/74159463 http://blog.csdn.net/linolzhang/article/details/75137050 http://blog.csdn.net/z5337209/articl 阅读全文

posted @ 2017-09-16 16:21 有梦就要去实现他阅读(747) 评论(0) 推荐(0)

对中间过程进行调试

摘要：这是观测stage2生成的rpn情况的代码：实际上就是根据train部分改的，要想可视化，还需要generate.py中将imdb_proposals函数更改：将0改为1 就可以了阅读全文

posted @ 2017-09-16 15:32 有梦就要去实现他阅读(415) 评论(0) 推荐(0)

进行可视化观测

摘要：test_net.py中的parser.add_argument('--vis', dest='vis', help='visualize detections', action='store_true') 改为parser.add_argument('--vis', dest='vis', hel 阅读全文

posted @ 2017-09-16 11:59 有梦就要去实现他阅读(286) 评论(0) 推荐(0)

随笔分类 - faster rcnn

公告