09 2017 档案
摘要:在anchor_target层,这两行是计算bounding regression代码: 以下是bounding regression的计算公式: argmax_overlaps是每个anchor对应最大overlap的gt_boxes的下标,所以bbox_targets存储的是anchor和最大o
阅读全文
摘要:rpn-data层输入的是data即整张图片,然后是根据映射生成roi框 rpn-loss-bbox输入的才是整个网络预测的roi框 bbox_transform在rpn-data层使用,把生成的achor,并不是把预测的roi框回归 rpn_loss_bbox,论文中定义输入是ti和ti*,ti和
阅读全文
摘要:http://blog.csdn.net/masibuaa/article/details/17924671 从这篇论文可以看出来,rcnn后面的提高方向好多都是基于这篇文章演化而来
阅读全文
摘要:这部分代码是把所有anchor中超过了图片边界部分的anchor去掉,即论文中说的cross-boundary anchors 这部分代码是把和gt-roi有最大iou的anchor和与任何gt-roi iou大于0.7的anchor的label置为1,即前景。这和论文中所说的是一样的。 把和所有g
阅读全文
摘要:在numpy中,'+' 和add 是一样的 有种特殊情况需要注意,x1和x2的shape不一样的加法: 两个shape不一样的array相加后会变成一个common shape x1是3x3的,x2是1x3的,加了之后就变成3x3,实际上是把x2在x1的第一维上加了3次 faster rcnn中的r
阅读全文
摘要:总结下来,用generate_anchors产生多种坐标变换,这种坐标变换由scale和ratio来,相当于提前计算好。anchor_target_layer先计算的是从feature map映射到原图的中点坐标,然后根据多种坐标变换生成不同的框。 anchor_target_layer层是产生在r
阅读全文
摘要:https://zhuanlan.zhihu.com/p/26938549 RCNN实际包含两个子步骤,一是对上一步的输出向量进行分类(需要根据特征训练分类器);二是通过边界回归(bounding-box regression) 得到精确的目标区域,由于实际目标会产生多个子区域,旨在对完成分类的前景
阅读全文
摘要:在使用fast rcnn以及faster rcnn做检测任务的时候,涉及到从图像的roi区域到feature map中roi的映射,然后再进行roi_pooling之类的操作。比如图像的大小是(600,800),在经过一系列的卷积以及pooling操作之后在某一个层中得到的feature map大小
阅读全文
摘要:http://www.cnblogs.com/lillylin/p/6277094.html ROI pooling操作的输入(对于C+1个类)是k^2*(C+1)*W' *H'(W'和H'是ROI的宽度和高度)的score map上某ROI对应的那个立体块,且该立体块组成一个新的k^2*(C+1)
阅读全文
摘要:roi pooling是先进行roi projection(即映射)然后再池化 映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层)。方法其实很简单,图片经过特征提取后,到最后一层卷积层时,真个图片是原始图片的1/16,你把roi的4个坐标都乘以1/16,也就变成了在这个卷积层上对应的坐标
阅读全文
摘要:从RFCN来看,Resnet-50和Resnet-101到最后一层卷积都是缩小到原来尺寸的16分之一,并且都用的7x7的格子去roi pooling。 看paper可以知道:resnet-50核心是由3个conv2_x(3个卷积层),4个conv3_x(3个卷积层),6个conv4_x(3个卷积层)
阅读全文
摘要:max pooling 在不同的 depth 上是分开执行的,且不需要参数控制。也就是说,pooling之后,feature map的维度不会改变
阅读全文
摘要:按照这个来http://blog.csdn.net/sinat_30071459/article/details/53202977
阅读全文
摘要:# Enter your network definition here. # Use Shift+Enter to update the visualization.name: "VGG_ILSVRC_16_layers" input: "data" input_dim: 16 input_dim: 3 input_dim: 224 input_dim: 224 layers { bo...
阅读全文
摘要:不要每次去2>&1 \tee out.log,好多模型本身会生成日子文件在experiment/log下
阅读全文
摘要:http://blog.csdn.net/baidu_24281959/article/details/53203757
阅读全文
摘要:Bbox-Lable-Tool https://github.com/puzzledqs/BBox-Label-Tool
阅读全文
摘要:我用的是下面这个脚本进行改名字: 但制作出来的图片顺序和原顺序不一样: 原因在于os.walk读取目录的文件不是按顺序的,或者说按某种顺序但我不知道,至少没有按照文件夹本来的文件顺序返回 利用all_image_index这个文件来实现不改变顺序的同时修改了文件的名字
阅读全文
摘要:用selective_search生成的坐标是(ymin,xmin,ymax,xmax),并且是从1开始的,不是从0 这是cache中的gt数据,明显看到有65535,说明很有可能是0-1变成了65535
阅读全文
摘要:im = imresize(im, [NaN im_width]):把图像转换为宽度为im_width,自动计算列数
阅读全文
摘要:http://blog.csdn.net/baiyu9821179/article/details/53365476 a=([3.234,34,3.777,6.33]) a为python的list类型 将a转化为numpy的array: np.array(a) array([ 3.234, 34.
阅读全文
摘要:错误代码: 这个错误是想提醒自己关于作用域的问题 如果把long long num = 0;放在for循环里,那这就是一个局部for循环的变量,但return num需要这个函数的全局变量,所以会报错
阅读全文
摘要:http://blog.csdn.net/XZZPPP/article/details/51582810 在这个特征图上使用3*3的卷积核(滑动窗口)与特征图进行卷积,那么这个3*3的区域卷积后可以获得一个256维的特征向量。因为这个3*3的区域上,每一个特征图上得到一个1维向量,256个特性图即可
阅读全文
摘要:http://www.cnblogs.com/houkai/p/6824455.html http://blog.csdn.net/u014696921/article/details/60321425
阅读全文
摘要:http://blog.csdn.net/u010417185/article/details/52619593
阅读全文
摘要:http://blog.csdn.net/linolzhang/article/details/74159463 http://blog.csdn.net/linolzhang/article/details/75137050 http://blog.csdn.net/z5337209/articl
阅读全文
摘要:这是观测stage2生成的rpn情况的代码: 实际上就是根据train部分改的,要想可视化,还需要generate.py中将imdb_proposals函数更改: 将0改为1 就可以了
阅读全文
摘要:test_net.py中的parser.add_argument('--vis', dest='vis', help='visualize detections', action='store_true') 改为parser.add_argument('--vis', dest='vis', hel
阅读全文
摘要:voc_eval.py里报错: ValueError: invalid literal for int() with base 10: '180.0' faster rcnn obj_struct['bbox'] = [int(bbox.find('xmin').text), int(bbox.fi
阅读全文
摘要:faster rcnn的运行脚本将训练和测试结合在了一起,最后会直接输出map 如果你要单独运行测试,可以用以下命令: python tools/test_net.py --gpu 0 --def models/pascal_voc/VGG16/faster_rcnn_alt_opt/faster_
阅读全文
摘要:1. 这个报错是由于numpy的版本问题,服务器电脑的numpy是1.13.1的,需要降到1.11.0 查看本机numpy版本:python -c "import numpy; print numpy.version.version" sudo pip install -U numpy==1.11.
阅读全文
摘要:>>> 2**np.arange(3, 6) array([ 8, 16, 32])
阅读全文
摘要:http://blog.csdn.net/u014696921/article/details/60321425
阅读全文
摘要:1.http://blog.csdn.net/u014696921/article/details/60321425 2.https://blog.csdn.net/zimenglan_sysu 3.https://blog.csdn.net/xbinworld
阅读全文
摘要:find <指定目录> <指定条件> <指定动作> 查找目录:find /(查找范围) -name '查找关键字' -type d
阅读全文
摘要:http://blog.csdn.net/xzzppp/article/details/52317863 源代码:https://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/rpn/generate_anchors.py
阅读全文
摘要:解决办法: http://blog.csdn.net/qq_33202928/article/details/72526710 在文件./lib/fast_rcnn/train.py增加一行import google.protobuf.text_format 即可解决问题
阅读全文
摘要:VOCdevkit2007文件下只保存VOC2007,VOC2007下只保存Annotations ImageSets JPEGImages。 JPEGImages存放所有的图片数据(即训练测试验证的图片都在里面),注意图片名字不再是原本图片名字,而是000001这种6位编号,制作过程中需要将所有图
阅读全文
摘要:http://blog.csdn.net/cnmilan/article/details/9259343 在Python中append 用来向 list 的末尾追加单个元素,如果增加的元素是一个list,那么这个list将作为一个整体进行追加。 例如: Python代码 li=['a', 'b']
阅读全文
摘要:参考博客:http://blog.csdn.net/juewu1993/article/details/54773269 http://blog.csdn.net/samylee/article/details/51201744 http://blog.csdn.net/sinat_30071459
阅读全文
摘要:c++方法: http://www.cnblogs.com/AngelLee2009/archive/2013/07/09/3180435.html python方法: https://zhidao.baidu.com/question/558955894.html 如果是10位不要写成"%10d"
阅读全文
摘要:步骤和fast rcnn的编译一样,在编译中遇到了一个问题: 刚开始是以为python-numpy没有安装到位,后来发现是Makefile.config的配置出现了问题。原来的配置是: PYTHON_INCLUDE := /usr/include/python2.7 \ /usr/lib/pytho
阅读全文
摘要:nvcc -V 没有找到直接查询cudann版本的命令,但发现cudann装在 /usr/local/cuda/lib64/目录下,libcudnn.so就是相应版本
阅读全文
摘要:ifconfig可以查看本机的ip地址:inet addr:10.108.104.185
阅读全文
摘要:一种错误写法: 如果只有两个数,begin < end就会陷入死循环
阅读全文
摘要:注意一个边界条件:必须是连续的,如果前后两个数是一样的也不满足条件
阅读全文
摘要:&既可以进行bool类型运算,也可以进行位与运算 &&只能进行bool类型运算
阅读全文
摘要:自己写的 注意:做位运算的与是&,不是&&
阅读全文
摘要:class Solution { public: bool hasCycle(ListNode *head) { if(head == NULL) return false; if(head->next == NULL) return false; ListNode* p1 = head;...
阅读全文
摘要:整个数组都初始化为0 整个vector初始化为1 如果你定义的vector是这样定义的: 去初始化,千万不要用: 这样会数组越界,因为你并没有申请vector大小
阅读全文
摘要:自己想的一个新的写法,如果不排除length=0的情况,下面那个while是死循环
阅读全文
摘要:没通过的代码: 三维vector初始化:http://blog.csdn.net/u013630349/article/details/47777645
阅读全文
摘要:这里: for(int j = 1;j <= m;j++) result[0][j] = 0x80000000; 不能从0开始,result[0][0]是可以取到的,是0。其他情况取不到才用最小表示。
阅读全文
摘要:注意j-A[i-1]必须大于等于0,只大于0会报错
阅读全文
摘要:f[i][j]表示的是以第i个结尾和第j个结尾
阅读全文
摘要:注意:因为开的空间是length+1的,对于字符串的下标计算要-1
阅读全文
摘要:初始化技巧: 在做字符串的dp时,对一个长度为n的字符串,往往要开n+1的空间,把0那一位留出来。因为定义前i个字符,自然分为前0个字符,前1个字符,前n个字符。前0的空串不能忽略,空串很重 要, 很多的结果是从空串来的。 这段代码前两个for循环是对子串回文串信息的初始化。利用一个二维数组记录子串
阅读全文
摘要:这里的result[0] = true值得注意 substr函数的第一个参数是开始的位置,第二个参数不是结束的位置,而是个数
阅读全文
摘要:这个题用DP,千万不能将state设为f[i]表示前i个数字中最长的LIS的长度 ,而是设成f[i]表示前i个数字中以第i个结尾的LIS的长度。如果那样定义,f[i]和f[j]之间是没有太大关系。 比如7,8,10,2,3,4,5可以,但2,3,9,10,5,6,7,8就不行 因为f[i]表示前i个
阅读全文
摘要:时间复杂度过高,o(n2)超时了: 把上面代码简化,依旧是超时 用贪心算法做,时间复杂度只有0(n) 推导过程: 两个讲解博客: http://blog.csdn.net/cinderella_niu/article/details/42804559 http://www.cnblogs.com/b
阅读全文
摘要:这种动规的方法时间复杂度是0(n²) 优化:记录能到达的最远距离,时间复杂度只有o(n)
阅读全文
摘要:注意一个容易犯的错误:判断obstacleGrid是否为1时,else那部分不能少。因为如果不加,就会默认把那些值设置为0。 初始化第一行第一列
阅读全文
摘要:初始化(0,0) 初始化第一行第一列
阅读全文
摘要:只初始化(0,0) 初始化第一行,第一列
阅读全文
摘要:1.刚开始result的初始化写的是vector<vector<int>> result,然后再去对result[0][0] = triangle[0][0]赋值,一直报错。老问题了! 2.多维vector的初始化: vector<vector<int>> result(height,vector<
阅读全文