2017 年 9月随笔档案 - 有梦就要去实现他

anchor_target_layer中的bounding regression

摘要：在anchor_target层，这两行是计算bounding regression代码：以下是bounding regression的计算公式： argmax_overlaps是每个anchor对应最大overlap的gt_boxes的下标，所以bbox_targets存储的是anchor和最大o 阅读全文

posted @ 2017-09-27 20:47 有梦就要去实现他阅读(487) 评论(0) 推荐(0) 编辑

faster rcnn结构

摘要：rpn-data层输入的是data即整张图片，然后是根据映射生成roi框 rpn-loss-bbox输入的才是整个网络预测的roi框 bbox_transform在rpn-data层使用，把生成的achor，并不是把预测的roi框回归 rpn_loss_bbox，论文中定义输入是ti和ti*，ti和阅读全文

posted @ 2017-09-27 16:09 有梦就要去实现他阅读(223) 评论(0) 推荐(0) 编辑

论文灵感

摘要：http://blog.csdn.net/masibuaa/article/details/17924671 从这篇论文可以看出来，rcnn后面的提高方向好多都是基于这篇文章演化而来阅读全文

posted @ 2017-09-27 15:38 有梦就要去实现他阅读(173) 评论(0) 推荐(0) 编辑

anchor_target_layer层其他部分解读

摘要：这部分代码是把所有anchor中超过了图片边界部分的anchor去掉，即论文中说的cross-boundary anchors 这部分代码是把和gt-roi有最大iou的anchor和与任何gt-roi iou大于0.7的anchor的label置为1，即前景。这和论文中所说的是一样的。把和所有g 阅读全文

posted @ 2017-09-27 15:07 有梦就要去实现他阅读(2500) 评论(0) 推荐(0) 编辑

numpy add

摘要：在numpy中，'+' 和add 是一样的有种特殊情况需要注意，x1和x2的shape不一样的加法：两个shape不一样的array相加后会变成一个common shape x1是3x3的，x2是1x3的，加了之后就变成3x3，实际上是把x2在x1的第一维上加了3次 faster rcnn中的r 阅读全文

posted @ 2017-09-26 17:53 有梦就要去实现他阅读(4078) 评论(0) 推荐(0) 编辑

numpy调试

摘要：拿这个来初始化进行调试阅读全文

posted @ 2017-09-26 17:35 有梦就要去实现他阅读(218) 评论(0) 推荐(0) 编辑

anchor_target_layer层解读

摘要：总结下来，用generate_anchors产生多种坐标变换，这种坐标变换由scale和ratio来，相当于提前计算好。anchor_target_layer先计算的是从feature map映射到原图的中点坐标，然后根据多种坐标变换生成不同的框。 anchor_target_layer层是产生在r 阅读全文

posted @ 2017-09-26 16:16 有梦就要去实现他阅读(2408) 评论(0) 推荐(0) 编辑

目标检测中bounding box regression

摘要：https://zhuanlan.zhihu.com/p/26938549 RCNN实际包含两个子步骤，一是对上一步的输出向量进行分类（需要根据特征训练分类器）；二是通过边界回归（bounding-box regression) 得到精确的目标区域，由于实际目标会产生多个子区域，旨在对完成分类的前景阅读全文

posted @ 2017-09-25 22:21 有梦就要去实现他阅读(1239) 评论(0) 推荐(0) 编辑

在CNN网络中roi从原图映射到feature map中的计算方法

摘要：在使用fast rcnn以及faster rcnn做检测任务的时候，涉及到从图像的roi区域到feature map中roi的映射，然后再进行roi_pooling之类的操作。比如图像的大小是（600,800），在经过一系列的卷积以及pooling操作之后在某一个层中得到的feature map大小阅读全文

posted @ 2017-09-25 16:36 有梦就要去实现他阅读(1965) 评论(0) 推荐(0) 编辑

rfcn讲解博客

摘要：http://www.cnblogs.com/lillylin/p/6277094.html ROI pooling操作的输入（对于C+1个类）是k^2*(C+1)*W' *H'（W'和H'是ROI的宽度和高度）的score map上某ROI对应的那个立体块，且该立体块组成一个新的k^2*(C+1) 阅读全文

posted @ 2017-09-25 16:25 有梦就要去实现他阅读(975) 评论(0) 推荐(0) 编辑

roi pooling层

摘要：roi pooling是先进行roi projection(即映射)然后再池化映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层)。方法其实很简单，图片经过特征提取后，到最后一层卷积层时，真个图片是原始图片的1/16，你把roi的4个坐标都乘以1/16，也就变成了在这个卷积层上对应的坐标阅读全文

posted @ 2017-09-24 14:03 有梦就要去实现他阅读(1233) 评论(0) 推荐(0) 编辑

把特征网络换成resnet-50

摘要：从RFCN来看，Resnet-50和Resnet-101到最后一层卷积都是缩小到原来尺寸的16分之一，并且都用的7x7的格子去roi pooling。看paper可以知道：resnet-50核心是由3个conv2_x（3个卷积层），4个conv3_x（3个卷积层），6个conv4_x（3个卷积层）阅读全文

posted @ 2017-09-24 13:54 有梦就要去实现他阅读(4535) 评论(0) 推荐(0) 编辑

pooling需要注意的一个地方

摘要：max pooling 在不同的 depth 上是分开执行的，且不需要参数控制。也就是说，pooling之后，feature map的维度不会改变阅读全文

posted @ 2017-09-24 13:24 有梦就要去实现他阅读(280) 评论(0) 推荐(0) 编辑

跑RFCN

摘要：按照这个来http://blog.csdn.net/sinat_30071459/article/details/53202977 阅读全文

posted @ 2017-09-23 21:12 有梦就要去实现他阅读(431) 评论(0) 推荐(0) 编辑

vgg16原始的protocol

摘要：# Enter your network definition here. # Use Shift+Enter to update the visualization.name: "VGG_ILSVRC_16_layers" input: "data" input_dim: 16 input_dim: 3 input_dim: 224 input_dim: 224 layers { bo... 阅读全文

posted @ 2017-09-23 21:11 有梦就要去实现他阅读(374) 评论(0) 推荐(0) 编辑

绘制loss曲线

摘要：不要每次去2>&1 \tee out.log，好多模型本身会生成日子文件在experiment/log下阅读全文

posted @ 2017-09-23 17:22 有梦就要去实现他阅读(224) 评论(0) 推荐(0) 编辑

resnet.caffemodel

摘要：http://blog.csdn.net/baidu_24281959/article/details/53203757 阅读全文

posted @ 2017-09-23 14:09 有梦就要去实现他阅读(440) 评论(0) 推荐(0) 编辑

标注数据的工具

摘要：Bbox-Lable-Tool https://github.com/puzzledqs/BBox-Label-Tool 阅读全文

posted @ 2017-09-23 13:46 有梦就要去实现他阅读(213) 评论(0) 推荐(0) 编辑

制作JPEGImages出现的bug

摘要：我用的是下面这个脚本进行改名字：但制作出来的图片顺序和原顺序不一样：原因在于os.walk读取目录的文件不是按顺序的，或者说按某种顺序但我不知道，至少没有按照文件夹本来的文件顺序返回利用all_image_index这个文件来实现不改变顺序的同时修改了文件的名字阅读全文

posted @ 2017-09-21 22:13 有梦就要去实现他阅读(306) 评论(0) 推荐(0) 编辑

检查bug

摘要：用selective_search生成的坐标是(ymin,xmin,ymax,xmax)，并且是从1开始的，不是从0 这是cache中的gt数据，明显看到有65535，说明很有可能是0-1变成了65535 阅读全文

posted @ 2017-09-21 16:46 有梦就要去实现他阅读(163) 评论(0) 推荐(0) 编辑

selective_search_rcnn.m中代码

摘要：im = imresize(im, [NaN im_width])：把图像转换为宽度为im_width，自动计算列数阅读全文

posted @ 2017-09-21 09:09 有梦就要去实现他阅读(172) 评论(0) 推荐(0) 编辑

用list去初始化numpy的array数组 numpy的array和python中自带的list之间相互转化

摘要：http://blog.csdn.net/baiyu9821179/article/details/53365476 a=([3.234,34,3.777,6.33]) a为python的list类型将a转化为numpy的array: np.array(a) array([ 3.234, 34. 阅读全文

posted @ 2017-09-18 22:16 有梦就要去实现他阅读(404) 评论(0) 推荐(0) 编辑

把字符串转化为整数

摘要：错误代码：这个错误是想提醒自己关于作用域的问题如果把long long num = 0;放在for循环里，那这就是一个局部for循环的变量，但return num需要这个函数的全局变量，所以会报错阅读全文

posted @ 2017-09-17 21:58 有梦就要去实现他阅读(192) 评论(0) 推荐(0) 编辑

这就是那个feature map256 256向量

摘要：http://blog.csdn.net/XZZPPP/article/details/51582810 在这个特征图上使用3*3的卷积核（滑动窗口）与特征图进行卷积，那么这个3*3的区域卷积后可以获得一个256维的特征向量。因为这个3*3的区域上，每一个特征图上得到一个1维向量，256个特性图即可阅读全文

posted @ 2017-09-16 19:52 有梦就要去实现他阅读(283) 评论(0) 推荐(0) 编辑

对faster rcnn代码讲解的很好的一个

摘要：http://www.cnblogs.com/houkai/p/6824455.html http://blog.csdn.net/u014696921/article/details/60321425 阅读全文

posted @ 2017-09-16 17:20 有梦就要去实现他阅读(443) 评论(0) 推荐(0) 编辑

input_shape { dim: 1 dim: 3 dim: 224 dim: 224 }

摘要：http://blog.csdn.net/u010417185/article/details/52619593 阅读全文

posted @ 2017-09-16 17:06 有梦就要去实现他阅读(342) 评论(0) 推荐(0) 编辑

faster rcnn的改进方向

摘要：http://blog.csdn.net/linolzhang/article/details/74159463 http://blog.csdn.net/linolzhang/article/details/75137050 http://blog.csdn.net/z5337209/articl 阅读全文

posted @ 2017-09-16 16:21 有梦就要去实现他阅读(730) 评论(0) 推荐(0) 编辑

对中间过程进行调试

摘要：这是观测stage2生成的rpn情况的代码：实际上就是根据train部分改的，要想可视化，还需要generate.py中将imdb_proposals函数更改：将0改为1 就可以了阅读全文

posted @ 2017-09-16 15:32 有梦就要去实现他阅读(392) 评论(0) 推荐(0) 编辑

进行可视化观测

摘要：test_net.py中的parser.add_argument('--vis', dest='vis', help='visualize detections', action='store_true') 改为parser.add_argument('--vis', dest='vis', hel 阅读全文

posted @ 2017-09-16 11:59 有梦就要去实现他阅读(277) 评论(0) 推荐(0) 编辑

测试过程报错

摘要：voc_eval.py里报错： ValueError: invalid literal for int() with base 10: '180.0' faster rcnn obj_struct['bbox'] = [int(bbox.find('xmin').text), int(bbox.fi 阅读全文

posted @ 2017-09-16 11:25 有梦就要去实现他阅读(413) 评论(0) 推荐(0) 编辑

测试

摘要：faster rcnn的运行脚本将训练和测试结合在了一起，最后会直接输出map 如果你要单独运行测试，可以用以下命令： python tools/test_net.py --gpu 0 --def models/pascal_voc/VGG16/faster_rcnn_alt_opt/faster_ 阅读全文

posted @ 2017-09-16 11:22 有梦就要去实现他阅读(217) 评论(0) 推荐(0) 编辑

训练过程中出现的报错

摘要：1. 这个报错是由于numpy的版本问题，服务器电脑的numpy是1.13.1的，需要降到1.11.0 查看本机numpy版本：python -c "import numpy; print numpy.version.version" sudo pip install -U numpy==1.11. 阅读全文

posted @ 2017-09-16 09:40 有梦就要去实现他阅读(429) 评论(0) 推荐(0) 编辑

numpy次方计算

摘要：>>> 2**np.arange(3, 6) array([ 8, 16, 32]) 阅读全文

posted @ 2017-09-15 21:48 有梦就要去实现他阅读(1707) 评论(0) 推荐(0) 编辑

faster rcnn训练过程讲解

摘要：http://blog.csdn.net/u014696921/article/details/60321425 阅读全文

posted @ 2017-09-15 16:01 有梦就要去实现他阅读(868) 评论(0) 推荐(0) 编辑

视觉好博客

摘要：1.http://blog.csdn.net/u014696921/article/details/60321425 2.https://blog.csdn.net/zimenglan_sysu 3.https://blog.csdn.net/xbinworld 阅读全文

posted @ 2017-09-15 15:59 有梦就要去实现他阅读(171) 评论(0) 推荐(0) 编辑

按名字寻找文件和文件夹 find命令

摘要：find <指定目录> <指定条件> <指定动作> 查找目录：find /（查找范围） -name '查找关键字' -type d 阅读全文

posted @ 2017-09-15 14:19 有梦就要去实现他阅读(379) 评论(0) 推荐(0) 编辑

产生多种anchor的代码讲解！很好！

摘要：http://blog.csdn.net/xzzppp/article/details/52317863 源代码：https://github.com/rbgirshick/py-faster-rcnn/blob/master/lib/rpn/generate_anchors.py 阅读全文

posted @ 2017-09-15 13:15 有梦就要去实现他阅读(962) 评论(0) 推荐(0) 编辑

一个报错

摘要：解决办法： http://blog.csdn.net/qq_33202928/article/details/72526710 在文件./lib/fast_rcnn/train.py增加一行import google.protobuf.text_format 即可解决问题阅读全文

posted @ 2017-09-15 11:21 有梦就要去实现他阅读(147) 评论(0) 推荐(0) 编辑

将自己的数据制作成voc格式

摘要：VOCdevkit2007文件下只保存VOC2007，VOC2007下只保存Annotations ImageSets JPEGImages。 JPEGImages存放所有的图片数据（即训练测试验证的图片都在里面），注意图片名字不再是原本图片名字，而是000001这种6位编号，制作过程中需要将所有图阅读全文

posted @ 2017-09-15 10:31 有梦就要去实现他阅读(982) 评论(0) 推荐(0) 编辑

Python list 增加/插入元素的说明

摘要：http://blog.csdn.net/cnmilan/article/details/9259343 在Python中append 用来向 list 的末尾追加单个元素，如果增加的元素是一个list，那么这个list将作为一个整体进行追加。例如： Python代码 li=['a', 'b'] 阅读全文

posted @ 2017-09-15 10:17 有梦就要去实现他阅读(15808) 评论(0) 推荐(1) 编辑

制作数据集

摘要：参考博客：http://blog.csdn.net/juewu1993/article/details/54773269 http://blog.csdn.net/samylee/article/details/51201744 http://blog.csdn.net/sinat_30071459 阅读全文

posted @ 2017-09-14 23:21 有梦就要去实现他阅读(269) 评论(0) 推荐(0) 编辑

将文件名从1变为000001

摘要：c++方法： http://www.cnblogs.com/AngelLee2009/archive/2013/07/09/3180435.html python方法： https://zhidao.baidu.com/question/558955894.html 如果是10位不要写成"%10d" 阅读全文

posted @ 2017-09-14 23:09 有梦就要去实现他阅读(960) 评论(0) 推荐(0) 编辑

faster rcnn环境编译

摘要：步骤和fast rcnn的编译一样，在编译中遇到了一个问题：刚开始是以为python-numpy没有安装到位，后来发现是Makefile.config的配置出现了问题。原来的配置是： PYTHON_INCLUDE := /usr/include/python2.7 \ /usr/lib/pytho 阅读全文

posted @ 2017-09-14 20:44 有梦就要去实现他阅读(284) 评论(0) 推荐(0) 编辑

查看cuda版本和cudann

摘要：nvcc -V 没有找到直接查询cudann版本的命令，但发现cudann装在 /usr/local/cuda/lib64/目录下，libcudnn.so就是相应版本阅读全文

posted @ 2017-09-14 19:48 有梦就要去实现他阅读(1037) 评论(0) 推荐(0) 编辑

把txt格式数据制作成xml数据

摘要：txt格式数据：代码：阅读全文

posted @ 2017-09-14 18:55 有梦就要去实现他阅读(633) 评论(0) 推荐(0) 编辑

查看本机的ip地址

摘要：ifconfig可以查看本机的ip地址：inet addr:10.108.104.185 阅读全文

posted @ 2017-09-14 12:57 有梦就要去实现他阅读(181) 评论(0) 推荐(0) 编辑

剑指offer8 旋转数组的最小数字

摘要：一种错误写法：如果只有两个数，begin < end就会陷入死循环阅读全文

posted @ 2017-09-13 14:24 有梦就要去实现他阅读(131) 评论(0) 推荐(0) 编辑

剑指offer44 扑克牌顺序

摘要：注意一个边界条件：必须是连续的，如果前后两个数是一样的也不满足条件阅读全文

posted @ 2017-09-13 11:03 有梦就要去实现他阅读(220) 评论(0) 推荐(0) 编辑

&和&&

摘要：&既可以进行bool类型运算，也可以进行位与运算 &&只能进行bool类型运算阅读全文

posted @ 2017-09-13 09:53 有梦就要去实现他阅读(135) 评论(0) 推荐(0) 编辑

剑指offer47 不用加减乘除做加法

摘要：自己写的注意：做位运算的与是&，不是&& 阅读全文

posted @ 2017-09-12 16:15 有梦就要去实现他阅读(100) 评论(0) 推荐(0) 编辑

141. Linked List Cycle 判断链表是否有环

摘要：class Solution { public: bool hasCycle(ListNode *head) { if(head == NULL) return false; if(head->next == NULL) return false; ListNode* p1 = head;... 阅读全文

posted @ 2017-09-12 13:41 有梦就要去实现他阅读(143) 评论(0) 推荐(0) 编辑

数组初始化和 vector初始化

摘要：整个数组都初始化为0 整个vector初始化为1 如果你定义的vector是这样定义的：去初始化，千万不要用：这样会数组越界，因为你并没有申请vector大小阅读全文

posted @ 2017-09-12 10:04 有梦就要去实现他阅读(626) 评论(0) 推荐(0) 编辑

剑指offer42 左旋转字符串

摘要：自己想的一个新的写法，如果不排除length=0的情况，下面那个while是死循环阅读全文

posted @ 2017-09-11 22:57 有梦就要去实现他阅读(116) 评论(0) 推荐(0) 编辑

k sum(lintcode)

摘要：没通过的代码：三维vector初始化：http://blog.csdn.net/u013630349/article/details/47777645 阅读全文

posted @ 2017-09-11 09:28 有梦就要去实现他阅读(157) 评论(0) 推荐(0) 编辑

背包问题2 （lintcode）

摘要：这里： for(int j = 1;j <= m;j++) result[0][j] = 0x80000000; 不能从0开始，result[0][0]是可以取到的，是0。其他情况取不到才用最小表示。阅读全文

posted @ 2017-09-10 19:55 有梦就要去实现他阅读(167) 评论(0) 推荐(0) 编辑

92.背包问题(lintcode)

摘要：注意j-A[i-1]必须大于等于0，只大于0会报错阅读全文

posted @ 2017-09-10 19:09 有梦就要去实现他阅读(185) 评论(0) 推荐(0) 编辑

72. Edit Distance

摘要：注意min函数只能比较两个参数阅读全文

posted @ 2017-09-10 17:03 有梦就要去实现他阅读(140) 评论(0) 推荐(0) 编辑

79 最长公共子串 (lintcode)

摘要：f[i][j]表示的是以第i个结尾和第j个结尾阅读全文

posted @ 2017-09-06 19:49 有梦就要去实现他阅读(202) 评论(0) 推荐(0) 编辑

77 最长公共子序列 (lintcode)

摘要：注意：因为开的空间是length+1的，对于字符串的下标计算要-1 阅读全文

posted @ 2017-09-06 19:39 有梦就要去实现他阅读(191) 评论(0) 推荐(0) 编辑

132. Palindrome Partitioning II

摘要：初始化技巧：在做字符串的dp时，对一个长度为n的字符串，往往要开n+1的空间，把0那一位留出来。因为定义前i个字符，自然分为前0个字符，前1个字符，前n个字符。前0的空串不能忽略，空串很重要，很多的结果是从空串来的。这段代码前两个for循环是对子串回文串信息的初始化。利用一个二维数组记录子串阅读全文

posted @ 2017-09-06 17:12 有梦就要去实现他阅读(118) 评论(0) 推荐(0) 编辑

139. Word Break

摘要：这里的result[0] = true值得注意 substr函数的第一个参数是开始的位置，第二个参数不是结束的位置，而是个数阅读全文

posted @ 2017-09-05 22:47 有梦就要去实现他阅读(136) 评论(0) 推荐(0) 编辑

300. Longest Increasing Subsequence

摘要：这个题用DP，千万不能将state设为f[i]表示前i个数字中最长的LIS的长度，而是设成f[i]表示前i个数字中以第i个结尾的LIS的长度。如果那样定义，f[i]和f[j]之间是没有太大关系。比如7,8,10,2,3,4,5可以，但2,3,9,10,5,6,7,8就不行因为f[i]表示前i个阅读全文

posted @ 2017-09-04 20:30 有梦就要去实现他阅读(156) 评论(0) 推荐(0) 编辑

45. Jump Game II

摘要：时间复杂度过高，o(n2)超时了：把上面代码简化，依旧是超时用贪心算法做，时间复杂度只有0(n) 推导过程：两个讲解博客： http://blog.csdn.net/cinderella_niu/article/details/42804559 http://www.cnblogs.com/b 阅读全文

posted @ 2017-09-04 16:02 有梦就要去实现他阅读(181) 评论(0) 推荐(0) 编辑

55.Jump Game

摘要：这种动规的方法时间复杂度是0（n²）优化：记录能到达的最远距离，时间复杂度只有o（n）阅读全文

posted @ 2017-09-02 21:41 有梦就要去实现他阅读(141) 评论(0) 推荐(0) 编辑

Unique Paths II

摘要：注意一个容易犯的错误：判断obstacleGrid是否为1时，else那部分不能少。因为如果不加，就会默认把那些值设置为0。初始化第一行第一列阅读全文

posted @ 2017-09-02 20:04 有梦就要去实现他阅读(149) 评论(0) 推荐(0) 编辑

62. Unique Paths

摘要：初始化（0,0）初始化第一行第一列阅读全文

posted @ 2017-09-02 19:22 有梦就要去实现他阅读(99) 评论(0) 推荐(0) 编辑

64. Minimum Path Sum

摘要：只初始化（0,0）初始化第一行，第一列阅读全文

posted @ 2017-09-02 18:44 有梦就要去实现他阅读(146) 评论(0) 推荐(0) 编辑

120. Triangle 以及一个多维vector如何初始化

摘要：1.刚开始result的初始化写的是vector<vector<int>> result,然后再去对result[0][0] = triangle[0][0]赋值，一直报错。老问题了！ 2.多维vector的初始化： vector<vector<int>> result(height,vector< 阅读全文

posted @ 2017-09-02 17:17 有梦就要去实现他阅读(246) 评论(0) 推荐(0) 编辑

09 2017 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论