随笔分类 - fast rcnn
摘要:ap:所有图片某一个类 map:所有图片所有类的ap的平均 以一个score为阈值,大于score的所有框是假定正确输出的所有预测,将这些框和gt匹配(iou大于某一个阈值认为匹配成功),得到当前score下的auccracy和recall,不同的score获得不同的auccracy和recall,
阅读全文
摘要:1.loss要规范化,这样就不会受图片大小的影响 2.w、h采用log:比较特殊的是w,hw,h的regression targets使用了log space. 师兄指点说这是为了降低w,hw,h产生的loss的数量级, 让它在loss里占的比重小些, 不至于因为w,hw,h的loss太大而让x,y
阅读全文
摘要:https://blog.csdn.net/wc781708249/article/details/79595174 按照这个安装就可以了
阅读全文
摘要:def voc_ap(rec, prec, use_07_metric=False): """ ap = voc_ap(rec, prec, [use_07_metric]) Compute VOC AP given precision and recall. If use_07_metric is true, uses the VOC 07 11 point...
阅读全文
摘要:fast中的_bbox_pred函数和faster中的bbox_transform_inv是一样的,是将框进行4个坐标变换得到新的框坐标。fast中是将selective search生成的框坐标进行回归变换,faster中用了两个地方,一个是把根据rpn滑动机制生成的anchor框进行回归变换,另
阅读全文
摘要:之前在fast rcnn,faster rcnn编译过程中USE_CUDNN := 1这一项一直是注释掉的(即不使用cudnn加速),编译会报错: 之所以会这样,是因为fast rcnn,faster rcnn代码默认是使用的cudnn v4,但我的服务器装的cudnn V6.0 解决这个问题有两种
阅读全文
摘要:roi pooling是先进行roi projection(即映射)然后再池化 映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层)。方法其实很简单,图片经过特征提取后,到最后一层卷积层时,真个图片是原始图片的1/16,你把roi的4个坐标都乘以1/16,也就变成了在这个卷积层上对应的坐标
阅读全文
摘要:用selective_search生成的坐标是(ymin,xmin,ymax,xmax),并且是从1开始的,不是从0 这是cache中的gt数据,明显看到有65535,说明很有可能是0-1变成了65535
阅读全文
摘要:im = imresize(im, [NaN im_width]):把图像转换为宽度为im_width,自动计算列数
阅读全文
摘要:http://blog.csdn.net/qq_25073253/article/details/73730249?locationNum=5&fps=1 https://groups.google.com/forum/#!topic/digits-users/FfeFp0MHQfQ http://
阅读全文
摘要:http://blog.csdn.net/qq_33202928/article/details/72526710
阅读全文
摘要:制作新数据集时需要重新制作train_GT,test_GT 代码:
阅读全文
摘要:之前的数据集的train和test是直接按照网上下载的数据的前7000个作为训练集,后2212个作为测试集。看得出来,这个数据集是由开车录制视频转换来的图片数据,后面2000多个图片的场景和前面的场景不太一样。所以将整个数据集随机打乱,随机分配7000个训练集和2212个测试集。下面是代码: 先按照
阅读全文
摘要:1.因为这个fast rcnn项目要自动进入一个ipython,用tee进行重定位后,终端就黑屏了,这个时候要像没重定位时那样退出ipython,用exit或ctrl+d
阅读全文
摘要:最初的图片有9421张,经过检查发现只有9218张图片进行了数据标注,还有6张图片是图片中只包含类别pedestrian,所以要将这些图片清除,最终图片个数是9212张
阅读全文
摘要:第一步保存日志文件,用重定向即可: 第二步直接绘制: 这个plot_training_log.py在这个目录下caffe-fast-rcnn/tools/extra 2是选择画哪种类型的图片,具体数字是代表哪个类型可以查看帮助信息看到: 0: Test accuracy vs. Iters 1: T
阅读全文
摘要:磁盘空间不足,导致无法写caffemodel
阅读全文
摘要:运行fast rcnn的train,会进入ipython,要先exit退出才能继续运行程序 绘制图像时,用了命令: ./tools/train_net.py --gpu 0 --solver models/VGG_CNN_M_1024/solver.prototxt --weights data/f
阅读全文
摘要:"libcudart.so.8.0 cannot open shared object file: No such file or directory" 解决办法是将一些文件复制到/usr/local/lib文件夹下: #注意自己CUDA的版本号! sudo cp /usr/local/cuda-8
阅读全文