随笔分类 -  faster rcnn

摘要:faster rcnn中这三层是单独生成的层,也是复现最复杂的层 anchor_target_layer作用:从众多的anchor中选取出正负样本供rpn网络学习(实际上就是把anchor和gt进行配对,配对后将这一对送给loss进行训练). 注意的点:从众多的anchor中随机选取128个正样本( 阅读全文
posted @ 2018-08-13 22:47 有梦就要去实现他 阅读(740) 评论(0) 推荐(0) 编辑
摘要:1.roi_pooling层是先利用spatial_scale将region proposal映射到feature map上,然后利用pooled_w、pooled_h分别将映射后的框的长度、宽度等分形成bin,最后对每个bin进行max_pooling,这其实就是一个spp-net的过程(只不过s 阅读全文
posted @ 2018-01-23 19:33 有梦就要去实现他 阅读(408) 评论(0) 推荐(0) 编辑
摘要:这是rpn网络train阶段的网络结构图 rpn_conv1之前的网络是特征提取层,也是和fast rcnn共享的层。rpn_conv1是一层1*1的卷积,这一层是单独为rpn网络多提取一层特征,这一层之后就接两个输出channel层不同的1*1的卷积(即分别进行score的预测和坐标补偿值的预测) 阅读全文
posted @ 2018-01-21 23:16 有梦就要去实现他 阅读(2038) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2018-01-18 15:24 有梦就要去实现他 阅读(646) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/terrenceyuu/article/details/76228317 https://www.cnblogs.com/houkai/p/6824455.html http://lib.csdn.net/article/computervison/6782 阅读全文
posted @ 2018-01-14 16:00 有梦就要去实现他 阅读(136) 评论(0) 推荐(0) 编辑
摘要:proposal_layer层是利用训练好的rpn网络来生成region proposal供fast rcnn使用。 proposal_layer整个处理过程:1.生成所有的anchor,对anchor进行4个坐标变换生成新的坐标变成proposals(按照老方法先在最后一层feature map的 阅读全文
posted @ 2017-10-14 22:12 有梦就要去实现他 阅读(2498) 评论(0) 推荐(0) 编辑
摘要:这个是对faster 问题的一个总结 http://blog.csdn.net/u010402786/article/details/72675831?locationNum=11&fps=1 这个代码应该是生成适合数据集的anchor的代码,但我没怎么看,之后可以看看: https://githu 阅读全文
posted @ 2017-10-08 15:58 有梦就要去实现他 阅读(171) 评论(0) 推荐(0) 编辑
摘要:在anchor_target层,这两行是计算bounding regression代码: 以下是bounding regression的计算公式: argmax_overlaps是每个anchor对应最大overlap的gt_boxes的下标,所以bbox_targets存储的是anchor和最大o 阅读全文
posted @ 2017-09-27 20:47 有梦就要去实现他 阅读(487) 评论(0) 推荐(0) 编辑
摘要:rpn-data层输入的是data即整张图片,然后是根据映射生成roi框 rpn-loss-bbox输入的才是整个网络预测的roi框 bbox_transform在rpn-data层使用,把生成的achor,并不是把预测的roi框回归 rpn_loss_bbox,论文中定义输入是ti和ti*,ti和 阅读全文
posted @ 2017-09-27 16:09 有梦就要去实现他 阅读(223) 评论(0) 推荐(0) 编辑
摘要:这部分代码是把所有anchor中超过了图片边界部分的anchor去掉,即论文中说的cross-boundary anchors 这部分代码是把和gt-roi有最大iou的anchor和与任何gt-roi iou大于0.7的anchor的label置为1,即前景。这和论文中所说的是一样的。 把和所有g 阅读全文
posted @ 2017-09-27 15:07 有梦就要去实现他 阅读(2500) 评论(0) 推荐(0) 编辑
摘要:总结下来,用generate_anchors产生多种坐标变换,这种坐标变换由scale和ratio来,相当于提前计算好。anchor_target_layer先计算的是从feature map映射到原图的中点坐标,然后根据多种坐标变换生成不同的框。 anchor_target_layer层是产生在r 阅读全文
posted @ 2017-09-26 16:16 有梦就要去实现他 阅读(2408) 评论(0) 推荐(0) 编辑
摘要:在使用fast rcnn以及faster rcnn做检测任务的时候,涉及到从图像的roi区域到feature map中roi的映射,然后再进行roi_pooling之类的操作。比如图像的大小是(600,800),在经过一系列的卷积以及pooling操作之后在某一个层中得到的feature map大小 阅读全文
posted @ 2017-09-25 16:36 有梦就要去实现他 阅读(1965) 评论(0) 推荐(0) 编辑
摘要:从RFCN来看,Resnet-50和Resnet-101到最后一层卷积都是缩小到原来尺寸的16分之一,并且都用的7x7的格子去roi pooling。 看paper可以知道:resnet-50核心是由3个conv2_x(3个卷积层),4个conv3_x(3个卷积层),6个conv4_x(3个卷积层) 阅读全文
posted @ 2017-09-24 13:54 有梦就要去实现他 阅读(4535) 评论(0) 推荐(0) 编辑
摘要:我用的是下面这个脚本进行改名字: 但制作出来的图片顺序和原顺序不一样: 原因在于os.walk读取目录的文件不是按顺序的,或者说按某种顺序但我不知道,至少没有按照文件夹本来的文件顺序返回 利用all_image_index这个文件来实现不改变顺序的同时修改了文件的名字 阅读全文
posted @ 2017-09-21 22:13 有梦就要去实现他 阅读(306) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/XZZPPP/article/details/51582810 在这个特征图上使用3*3的卷积核(滑动窗口)与特征图进行卷积,那么这个3*3的区域卷积后可以获得一个256维的特征向量。因为这个3*3的区域上,每一个特征图上得到一个1维向量,256个特性图即可 阅读全文
posted @ 2017-09-16 19:52 有梦就要去实现他 阅读(283) 评论(0) 推荐(0) 编辑
摘要:http://www.cnblogs.com/houkai/p/6824455.html http://blog.csdn.net/u014696921/article/details/60321425 阅读全文
posted @ 2017-09-16 17:20 有梦就要去实现他 阅读(443) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/u010417185/article/details/52619593 阅读全文
posted @ 2017-09-16 17:06 有梦就要去实现他 阅读(342) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/linolzhang/article/details/74159463 http://blog.csdn.net/linolzhang/article/details/75137050 http://blog.csdn.net/z5337209/articl 阅读全文
posted @ 2017-09-16 16:21 有梦就要去实现他 阅读(730) 评论(0) 推荐(0) 编辑
摘要:这是观测stage2生成的rpn情况的代码: 实际上就是根据train部分改的,要想可视化,还需要generate.py中将imdb_proposals函数更改: 将0改为1 就可以了 阅读全文
posted @ 2017-09-16 15:32 有梦就要去实现他 阅读(392) 评论(0) 推荐(0) 编辑
摘要:test_net.py中的parser.add_argument('--vis', dest='vis', help='visualize detections', action='store_true') 改为parser.add_argument('--vis', dest='vis', hel 阅读全文
posted @ 2017-09-16 11:59 有梦就要去实现他 阅读(277) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示