随笔分类 -  fast rcnn

摘要:ap:所有图片某一个类 map:所有图片所有类的ap的平均 以一个score为阈值,大于score的所有框是假定正确输出的所有预测,将这些框和gt匹配(iou大于某一个阈值认为匹配成功),得到当前score下的auccracy和recall,不同的score获得不同的auccracy和recall, 阅读全文
posted @ 2018-10-20 11:15 有梦就要去实现他 阅读(761) 评论(0) 推荐(0) 编辑
摘要:1.loss要规范化,这样就不会受图片大小的影响 2.w、h采用log:比较特殊的是w,hw,h的regression targets使用了log space. 师兄指点说这是为了降低w,hw,h产生的loss的数量级, 让它在loss里占的比重小些, 不至于因为w,hw,h的loss太大而让x,y 阅读全文
posted @ 2018-09-24 20:21 有梦就要去实现他 阅读(657) 评论(0) 推荐(0) 编辑
摘要:https://blog.csdn.net/wc781708249/article/details/79595174 按照这个安装就可以了 阅读全文
posted @ 2018-07-18 15:37 有梦就要去实现他 阅读(207) 评论(0) 推荐(0) 编辑
摘要:def voc_ap(rec, prec, use_07_metric=False): """ ap = voc_ap(rec, prec, [use_07_metric]) Compute VOC AP given precision and recall. If use_07_metric is true, uses the VOC 07 11 point... 阅读全文
posted @ 2018-07-06 14:51 有梦就要去实现他 阅读(503) 评论(0) 推荐(0) 编辑
摘要:fast中的_bbox_pred函数和faster中的bbox_transform_inv是一样的,是将框进行4个坐标变换得到新的框坐标。fast中是将selective search生成的框坐标进行回归变换,faster中用了两个地方,一个是把根据rpn滑动机制生成的anchor框进行回归变换,另 阅读全文
posted @ 2017-10-15 12:47 有梦就要去实现他 阅读(2336) 评论(0) 推荐(0) 编辑
摘要:之前在fast rcnn,faster rcnn编译过程中USE_CUDNN := 1这一项一直是注释掉的(即不使用cudnn加速),编译会报错: 之所以会这样,是因为fast rcnn,faster rcnn代码默认是使用的cudnn v4,但我的服务器装的cudnn V6.0 解决这个问题有两种 阅读全文
posted @ 2017-10-01 17:43 有梦就要去实现他 阅读(425) 评论(0) 推荐(0) 编辑
摘要:roi pooling是先进行roi projection(即映射)然后再池化 映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层)。方法其实很简单,图片经过特征提取后,到最后一层卷积层时,真个图片是原始图片的1/16,你把roi的4个坐标都乘以1/16,也就变成了在这个卷积层上对应的坐标 阅读全文
posted @ 2017-09-24 14:03 有梦就要去实现他 阅读(1233) 评论(0) 推荐(0) 编辑
摘要:用selective_search生成的坐标是(ymin,xmin,ymax,xmax),并且是从1开始的,不是从0 这是cache中的gt数据,明显看到有65535,说明很有可能是0-1变成了65535 阅读全文
posted @ 2017-09-21 16:46 有梦就要去实现他 阅读(163) 评论(0) 推荐(0) 编辑
摘要:im = imresize(im, [NaN im_width]):把图像转换为宽度为im_width,自动计算列数 阅读全文
posted @ 2017-09-21 09:09 有梦就要去实现他 阅读(172) 评论(0) 推荐(0) 编辑
摘要:fast faster都识别不了20*20以下的像素 阅读全文
posted @ 2017-08-22 12:48 有梦就要去实现他 阅读(100) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/qq_25073253/article/details/73730249?locationNum=5&fps=1 https://groups.google.com/forum/#!topic/digits-users/FfeFp0MHQfQ http:// 阅读全文
posted @ 2017-08-21 09:27 有梦就要去实现他 阅读(106) 评论(0) 推荐(0) 编辑
摘要:http://blog.csdn.net/qq_33202928/article/details/72526710 阅读全文
posted @ 2017-08-21 09:12 有梦就要去实现他 阅读(554) 评论(0) 推荐(0) 编辑
摘要:制作新数据集时需要重新制作train_GT,test_GT 代码: 阅读全文
posted @ 2017-08-20 23:25 有梦就要去实现他 阅读(301) 评论(0) 推荐(0) 编辑
摘要:之前的数据集的train和test是直接按照网上下载的数据的前7000个作为训练集,后2212个作为测试集。看得出来,这个数据集是由开车录制视频转换来的图片数据,后面2000多个图片的场景和前面的场景不太一样。所以将整个数据集随机打乱,随机分配7000个训练集和2212个测试集。下面是代码: 先按照 阅读全文
posted @ 2017-08-19 16:36 有梦就要去实现他 阅读(824) 评论(0) 推荐(0) 编辑
摘要:1.因为这个fast rcnn项目要自动进入一个ipython,用tee进行重定位后,终端就黑屏了,这个时候要像没重定位时那样退出ipython,用exit或ctrl+d 阅读全文
posted @ 2017-08-18 13:52 有梦就要去实现他 阅读(202) 评论(0) 推荐(0) 编辑
摘要:最初的图片有9421张,经过检查发现只有9218张图片进行了数据标注,还有6张图片是图片中只包含类别pedestrian,所以要将这些图片清除,最终图片个数是9212张 阅读全文
posted @ 2017-06-21 14:45 有梦就要去实现他 阅读(274) 评论(0) 推荐(0) 编辑
摘要:第一步保存日志文件,用重定向即可: 第二步直接绘制: 这个plot_training_log.py在这个目录下caffe-fast-rcnn/tools/extra 2是选择画哪种类型的图片,具体数字是代表哪个类型可以查看帮助信息看到: 0: Test accuracy vs. Iters 1: T 阅读全文
posted @ 2017-06-21 14:14 有梦就要去实现他 阅读(23943) 评论(1) 推荐(0) 编辑
摘要:磁盘空间不足,导致无法写caffemodel 阅读全文
posted @ 2017-06-21 13:34 有梦就要去实现他 阅读(205) 评论(0) 推荐(0) 编辑
摘要:运行fast rcnn的train,会进入ipython,要先exit退出才能继续运行程序 绘制图像时,用了命令: ./tools/train_net.py --gpu 0 --solver models/VGG_CNN_M_1024/solver.prototxt --weights data/f 阅读全文
posted @ 2017-06-19 20:42 有梦就要去实现他 阅读(1172) 评论(0) 推荐(0) 编辑
摘要:"libcudart.so.8.0 cannot open shared object file: No such file or directory" 解决办法是将一些文件复制到/usr/local/lib文件夹下: #注意自己CUDA的版本号! sudo cp /usr/local/cuda-8 阅读全文
posted @ 2017-06-19 12:57 有梦就要去实现他 阅读(240) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示