fast rcnn - 随笔分类 - 有梦就要去实现他

ap、map值计算

摘要：ap:所有图片某一个类 map:所有图片所有类的ap的平均以一个score为阈值，大于score的所有框是假定正确输出的所有预测，将这些框和gt匹配(iou大于某一个阈值认为匹配成功)，得到当前score下的auccracy和recall，不同的score获得不同的auccracy和recall，阅读全文

posted @ 2018-10-20 11:15 有梦就要去实现他阅读(761) 评论(0) 推荐(0) 编辑

smooth l1

摘要：1.loss要规范化，这样就不会受图片大小的影响 2.w、h采用log：比较特殊的是w,hw,h的regression targets使用了log space. 师兄指点说这是为了降低w,hw,h产生的loss的数量级, 让它在loss里占的比重小些, 不至于因为w,hw,h的loss太大而让x,y 阅读全文

posted @ 2018-09-24 20:21 有梦就要去实现他阅读(657) 评论(0) 推荐(0) 编辑

labelme也可以标注polygan

摘要：https://blog.csdn.net/wc781708249/article/details/79595174 按照这个安装就可以了阅读全文

posted @ 2018-07-18 15:37 有梦就要去实现他阅读(207) 评论(0) 推荐(0) 编辑

fast、faster中ap值的计算

摘要：def voc_ap(rec, prec, use_07_metric=False): """ ap = voc_ap(rec, prec, [use_07_metric]) Compute VOC AP given precision and recall. If use_07_metric is true, uses the VOC 07 11 point... 阅读全文

posted @ 2018-07-06 14:51 有梦就要去实现他阅读(503) 评论(0) 推荐(0) 编辑

_bbox_pred函数

摘要：fast中的_bbox_pred函数和faster中的bbox_transform_inv是一样的，是将框进行4个坐标变换得到新的框坐标。fast中是将selective search生成的框坐标进行回归变换，faster中用了两个地方，一个是把根据rpn滑动机制生成的anchor框进行回归变换，另阅读全文

posted @ 2017-10-15 12:47 有梦就要去实现他阅读(2336) 评论(0) 推荐(0) 编辑

fast rcnn，faster rcnn使用cudann加速问题

摘要：之前在fast rcnn，faster rcnn编译过程中USE_CUDNN := 1这一项一直是注释掉的(即不使用cudnn加速)，编译会报错：之所以会这样，是因为fast rcnn，faster rcnn代码默认是使用的cudnn v4，但我的服务器装的cudnn V6.0 解决这个问题有两种阅读全文

posted @ 2017-10-01 17:43 有梦就要去实现他阅读(425) 评论(0) 推荐(0) 编辑

roi pooling层

摘要：roi pooling是先进行roi projection(即映射)然后再池化映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层)。方法其实很简单，图片经过特征提取后，到最后一层卷积层时，真个图片是原始图片的1/16，你把roi的4个坐标都乘以1/16，也就变成了在这个卷积层上对应的坐标阅读全文

posted @ 2017-09-24 14:03 有梦就要去实现他阅读(1233) 评论(0) 推荐(0) 编辑

检查bug

摘要：用selective_search生成的坐标是(ymin,xmin,ymax,xmax)，并且是从1开始的，不是从0 这是cache中的gt数据，明显看到有65535，说明很有可能是0-1变成了65535 阅读全文

posted @ 2017-09-21 16:46 有梦就要去实现他阅读(163) 评论(0) 推荐(0) 编辑

selective_search_rcnn.m中代码

摘要：im = imresize(im, [NaN im_width])：把图像转换为宽度为im_width，自动计算列数阅读全文

posted @ 2017-09-21 09:09 有梦就要去实现他阅读(172) 评论(0) 推荐(0) 编辑

很重要的一点

摘要：fast faster都识别不了20*20以下的像素阅读全文

posted @ 2017-08-22 12:48 有梦就要去实现他阅读(100) 评论(0) 推荐(0) 编辑

几个要清理的地方

摘要：http://blog.csdn.net/qq_25073253/article/details/73730249?locationNum=5&fps=1 https://groups.google.com/forum/#!topic/digits-users/FfeFp0MHQfQ http:// 阅读全文

posted @ 2017-08-21 09:27 有梦就要去实现他阅读(106) 评论(0) 推荐(0) 编辑

pb2.text_format.Merge(f.read(), self.solver_param) AttributeError: 'module' object has no attribute 'text_format'

摘要：http://blog.csdn.net/qq_33202928/article/details/72526710 阅读全文

posted @ 2017-08-21 09:12 有梦就要去实现他阅读(554) 评论(0) 推荐(0) 编辑

新数据的GT列表

摘要：制作新数据集时需要重新制作train_GT，test_GT 代码：阅读全文

posted @ 2017-08-20 23:25 有梦就要去实现他阅读(301) 评论(0) 推荐(0) 编辑

制作新的train，test数据集

摘要：之前的数据集的train和test是直接按照网上下载的数据的前7000个作为训练集，后2212个作为测试集。看得出来，这个数据集是由开车录制视频转换来的图片数据，后面2000多个图片的场景和前面的场景不太一样。所以将整个数据集随机打乱，随机分配7000个训练集和2212个测试集。下面是代码：先按照阅读全文

posted @ 2017-08-19 16:36 有梦就要去实现他阅读(824) 评论(0) 推荐(0) 编辑

项目中遇到的问题

摘要：1.因为这个fast rcnn项目要自动进入一个ipython，用tee进行重定位后，终端就黑屏了，这个时候要像没重定位时那样退出ipython，用exit或ctrl+d 阅读全文

posted @ 2017-08-18 13:52 有梦就要去实现他阅读(202) 评论(0) 推荐(0) 编辑

数据预处理时的一些问题

摘要：最初的图片有9421张，经过检查发现只有9218张图片进行了数据标注，还有6张图片是图片中只包含类别pedestrian，所以要将这些图片清除，最终图片个数是9212张阅读全文

posted @ 2017-06-21 14:45 有梦就要去实现他阅读(274) 评论(0) 推荐(0) 编辑

绘制loss曲线

摘要：第一步保存日志文件，用重定向即可：第二步直接绘制：这个plot_training_log.py在这个目录下caffe-fast-rcnn/tools/extra 2是选择画哪种类型的图片,具体数字是代表哪个类型可以查看帮助信息看到： 0: Test accuracy vs. Iters 1: T 阅读全文

posted @ 2017-06-21 14:14 有梦就要去实现他阅读(23943) 评论(1) 推荐(0) 编辑

磁盘空间不足引起的报错

摘要：磁盘空间不足，导致无法写caffemodel 阅读全文

posted @ 2017-06-21 13:34 有梦就要去实现他阅读(205) 评论(0) 推荐(0) 编辑

用fast rcnn绘制loss曲线遇到的问题

摘要：运行fast rcnn的train,会进入ipython，要先exit退出才能继续运行程序绘制图像时，用了命令： ./tools/train_net.py --gpu 0 --solver models/VGG_CNN_M_1024/solver.prototxt --weights data/f 阅读全文

posted @ 2017-06-19 20:42 有梦就要去实现他阅读(1172) 评论(0) 推荐(0) 编辑

报错解决

摘要："libcudart.so.8.0 cannot open shared object file: No such file or directory" 解决办法是将一些文件复制到/usr/local/lib文件夹下： #注意自己CUDA的版本号！ sudo cp /usr/local/cuda-8 阅读全文

posted @ 2017-06-19 12:57 有梦就要去实现他阅读(240) 评论(0) 推荐(0) 编辑

随笔分类 - fast rcnn

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论