随笔分类 - faster rcnn
摘要:faster rcnn中这三层是单独生成的层,也是复现最复杂的层 anchor_target_layer作用:从众多的anchor中选取出正负样本供rpn网络学习(实际上就是把anchor和gt进行配对,配对后将这一对送给loss进行训练). 注意的点:从众多的anchor中随机选取128个正样本(
阅读全文
摘要:1.roi_pooling层是先利用spatial_scale将region proposal映射到feature map上,然后利用pooled_w、pooled_h分别将映射后的框的长度、宽度等分形成bin,最后对每个bin进行max_pooling,这其实就是一个spp-net的过程(只不过s
阅读全文
摘要:这是rpn网络train阶段的网络结构图 rpn_conv1之前的网络是特征提取层,也是和fast rcnn共享的层。rpn_conv1是一层1*1的卷积,这一层是单独为rpn网络多提取一层特征,这一层之后就接两个输出channel层不同的1*1的卷积(即分别进行score的预测和坐标补偿值的预测)
阅读全文
摘要:http://blog.csdn.net/terrenceyuu/article/details/76228317 https://www.cnblogs.com/houkai/p/6824455.html http://lib.csdn.net/article/computervison/6782
阅读全文
摘要:proposal_layer层是利用训练好的rpn网络来生成region proposal供fast rcnn使用。 proposal_layer整个处理过程:1.生成所有的anchor,对anchor进行4个坐标变换生成新的坐标变成proposals(按照老方法先在最后一层feature map的
阅读全文
摘要:这个是对faster 问题的一个总结 http://blog.csdn.net/u010402786/article/details/72675831?locationNum=11&fps=1 这个代码应该是生成适合数据集的anchor的代码,但我没怎么看,之后可以看看: https://githu
阅读全文
摘要:在anchor_target层,这两行是计算bounding regression代码: 以下是bounding regression的计算公式: argmax_overlaps是每个anchor对应最大overlap的gt_boxes的下标,所以bbox_targets存储的是anchor和最大o
阅读全文
摘要:rpn-data层输入的是data即整张图片,然后是根据映射生成roi框 rpn-loss-bbox输入的才是整个网络预测的roi框 bbox_transform在rpn-data层使用,把生成的achor,并不是把预测的roi框回归 rpn_loss_bbox,论文中定义输入是ti和ti*,ti和
阅读全文
摘要:这部分代码是把所有anchor中超过了图片边界部分的anchor去掉,即论文中说的cross-boundary anchors 这部分代码是把和gt-roi有最大iou的anchor和与任何gt-roi iou大于0.7的anchor的label置为1,即前景。这和论文中所说的是一样的。 把和所有g
阅读全文
摘要:总结下来,用generate_anchors产生多种坐标变换,这种坐标变换由scale和ratio来,相当于提前计算好。anchor_target_layer先计算的是从feature map映射到原图的中点坐标,然后根据多种坐标变换生成不同的框。 anchor_target_layer层是产生在r
阅读全文
摘要:在使用fast rcnn以及faster rcnn做检测任务的时候,涉及到从图像的roi区域到feature map中roi的映射,然后再进行roi_pooling之类的操作。比如图像的大小是(600,800),在经过一系列的卷积以及pooling操作之后在某一个层中得到的feature map大小
阅读全文
摘要:从RFCN来看,Resnet-50和Resnet-101到最后一层卷积都是缩小到原来尺寸的16分之一,并且都用的7x7的格子去roi pooling。 看paper可以知道:resnet-50核心是由3个conv2_x(3个卷积层),4个conv3_x(3个卷积层),6个conv4_x(3个卷积层)
阅读全文
摘要:我用的是下面这个脚本进行改名字: 但制作出来的图片顺序和原顺序不一样: 原因在于os.walk读取目录的文件不是按顺序的,或者说按某种顺序但我不知道,至少没有按照文件夹本来的文件顺序返回 利用all_image_index这个文件来实现不改变顺序的同时修改了文件的名字
阅读全文
摘要:http://blog.csdn.net/XZZPPP/article/details/51582810 在这个特征图上使用3*3的卷积核(滑动窗口)与特征图进行卷积,那么这个3*3的区域卷积后可以获得一个256维的特征向量。因为这个3*3的区域上,每一个特征图上得到一个1维向量,256个特性图即可
阅读全文
摘要:http://www.cnblogs.com/houkai/p/6824455.html http://blog.csdn.net/u014696921/article/details/60321425
阅读全文
摘要:http://blog.csdn.net/u010417185/article/details/52619593
阅读全文
摘要:http://blog.csdn.net/linolzhang/article/details/74159463 http://blog.csdn.net/linolzhang/article/details/75137050 http://blog.csdn.net/z5337209/articl
阅读全文
摘要:这是观测stage2生成的rpn情况的代码: 实际上就是根据train部分改的,要想可视化,还需要generate.py中将imdb_proposals函数更改: 将0改为1 就可以了
阅读全文
摘要:test_net.py中的parser.add_argument('--vis', dest='vis', help='visualize detections', action='store_true') 改为parser.add_argument('--vis', dest='vis', hel
阅读全文