06 2018 档案
摘要:refinedet只预测4个层,并且只有conv6_1、conv6_2,没有ssd中的conv7、8、9 refinedet的4个层都只有1个aspect ratio和1个min_size,所以每层每个点只有3个anchor,arm中做location的conv4_3_norm_mbox_loc等层
阅读全文
摘要:总结说来prior_box层只完成了一个提取anchor的过程,其他与gt的match,筛选正负样本比例都是在multibox_loss_layer完成的 http://www.360doc.com/content/17/0810/10/10408243_678091430.shtml 1.以mob
阅读全文
摘要:https://www.jianshu.com/p/5195165bbd06 1.step_w、step_h其实就相当于faster中的feat_stride,也就是把这些点从feature map映射回原图,同时也可以看出min_size、max_size这些都是直接在针对原图来讲的 2.以mob
阅读全文
摘要:name: "vgg_1/8" layer { name: "data" type: "AnnotatedData" top: "data" top: "label" include { phase: TRAIN } transform_param { mirror: true mean_value: 104.0 mean_value:...
阅读全文
摘要:https://www.letslearnai.com/2018/03/10/what-are-l1-and-l2-loss-functions.html http://rishy.github.io/ml/2015/07/28/l1-vs-l2-loss/ L1-loss L2-loss L1 l
阅读全文
摘要:个人感觉相当于L2范式开平方,也相当于针对两个向量的欧氏距离开平方 说的更直白点就是两个向量对应位置相减得到每个位置的差,然后把每个位置的差开平方再相加 前向传播cpp代码: 注意:caffe_cpu_dot做的是点积,点积对应点相乘后还要把所有这些乘积结果相加,不只是做乘积 将bottom0和bo
阅读全文
摘要:1.解决方案 下边缘: a.论文的数据来自kitti,gt数据来自于激光雷达,利用kitti自带的开发包先将激光雷达的数据映射到图片的二维平面,每个x,y会生成对应的d(x,y),即depth.再对每个x,y求倒数,即1/d,即D(x,y).对每个D求y方向的偏导,图像的偏导就是f'y(x,y) =
阅读全文
摘要:陀螺仪的使用解释:https://zhuanlan.zhihu.com/p/29244429 手机坐标轴的图片:http://jcjs.siat.ac.cn/ch/reader/create_pdf.aspx?file_no=201403007&year_id=2014&quarter_id=3&f
阅读全文
摘要:https://blog.csdn.net/github_38414650/article/details/76061893 https://www.cnblogs.com/xlingbai/p/8274250.html https://blog.csdn.net/a1b2c3d4123456/ar
阅读全文
摘要:https://leetcode.com/problems/interleaving-string/discuss/31879/My-DP-solution-in-C++
阅读全文
摘要:https://leetcode.com/problems/distinct-subsequences/discuss/37327/Easy-to-understand-DP-in-Java 如果S[i]==T[j],那么dp[i][j] = dp[i-1][j-1] + dp[i-1][j]。意思
阅读全文
摘要:这是在frcnn_data_layer的操作,即读图片的操作 这里的param是来自于这一层的参数FrcnnTrainDataParameter param = this->layer_param_.frcnn_train_data_param(); mu默认是0,sigma默认是8 randn是m
阅读全文
摘要:opencv的resize默认的是使用双线性插值INTER_LINEAR,也可以是尝试其他的方式进行插值操作
阅读全文
摘要:frcnn_train_data_param 下面是frcnn_train_data_layer使用distort的代码,通过调用ApplyDistort函数来实现,这个函数是在im_transforms.cpp里实现的 DistortionParameter是caffe.proto中的messag
阅读全文
摘要:就是将rgb图的3个channel随机打乱顺序,给定一个概率值是否执行这个操作,v系列模型的概率一般都设置的为0
阅读全文
摘要:https://www.cnblogs.com/wangyblzu/p/5710715.html HSV和RGB一样是一种图像的颜色模型,h表示色调,s表示饱和度 1.RandomHue 需要先把rgb图转成hsv图,然后对第一个通道也就是h的通道的每个值加上delta,最后再换转成rgb图 2.R
阅读全文
摘要:https://leetcode.com/problems/edit-distance/discuss/25846/20ms-Detailed-Explained-C++-Solutions-(O(n)-Space) 注意:初始化的时候,不再是以前那样[0,i]、[i,0]为0,而是相应的值。这是可
阅读全文
摘要:第一周:1.所有的参数的trick 2.整个v、d系列模型的演进 3.ma周报中所有的trick 4.trick list中的所有trick 5.自己的trick整理 6.简历的修改,请杨一起来讨论,特别是上一份实习中应该被剔除的部分 第二周:1.卡尔曼滤波 2.ssd项目的整理和ssd相关论文整理
阅读全文
摘要:1. opencv的convertTo的讲解:https://blog.csdn.net/qq_22764813/article/details/52135686 https://blog.csdn.net/qq_15505637/article/details/53887274 type是是否改变
阅读全文
摘要:数据输入方面:1.image pyramid 图像金字塔.目前代码里是先选取一个scale,然后在每个GPU上按照scale读图片,相应的gt也更改."scales":[440, 520, 600, 680, 760] 使用的是短边的缩放到的尺寸,还用个maxsize限制了你的scale必须小于一个
阅读全文
摘要:ckpt存储参数值 pbtxt存储网络图 pb既存储参数值又存储网络图
阅读全文
摘要:http://www.eguidedog.net/linux-tutorial/05-grep.php grep apple fruitlist.txt:在fruitlist.txt中查找apple字符串 grep -i apple fruitlist.txt:忽略大小写查找 grep -nr ap
阅读全文
摘要:正则化是为了防止过拟合,因为正则化能降低权重 caffe默认L2正则化 代码讲解的地址:http://alanse7en.github.io/caffedai-ma-jie-xi-4/ 重要的一个回答:https://stats.stackexchange.com/questions/29130/d
阅读全文
摘要:kitti和cityscape的gt的分割不太一样,下边缘不再是从黑色开始的,而是直接是类别 red,green,blue = img_gt[i,j] 1.道路的颜色(紫色):128 64 128 2.汽车的颜色(蓝色):142 0 03.人行道的颜色(朱红色):232 35 2444.树和绿色植物
阅读全文
摘要:1.底层到高层的skip connection,最好是在底层的feature mappool之后加一层3*3或者1*1卷积,这样是因为可能浅层的feature map的数值范围在100-1000,高层的在1-100,这样会出现错误(具体错误看马的周报) 2.金字塔结构,输入图片的特征金字塔和feat
阅读全文
摘要:Longest Common Subsequence最长公共子序列: 每个dp位置表示的是第i、j个字母的最长公共子序列 Longest Common Substring最长公共子串 每个dp代表以i、j这个坐标的最长公共子串,所以求最终的要遍历所有的 更简洁的一种写法: 相同:都要建立m+1,n+
阅读全文
摘要:传感器获取数据的频率: https://blog.csdn.net/huangbiao86/article/details/6745933 SensorManager.SENSOR_DELAY_GAME 20ms
阅读全文
摘要:Heterogeneity Activity Recognition Data Set:https://archive.ics.uci.edu/ml/datasets/Heterogeneity+Activity+Recognition 经过https://github.com/yscacaca/H
阅读全文
摘要:1.用psmnet获得更好的disparity 2.用edgebox获得整个rgb图片的边缘,然后通过原本的stixel的上下边缘去寻找最优,用两个的边缘去重新得到一个新的边缘,但获得的轮廓不仅仅是外轮廓还有内部的轮廓,得出的结果比之前没有太多提升. 目前可以尝试在disparity图求边缘这种方式
阅读全文
摘要:1.yolo-v1,yolo-v2,yolo-v3 2.ssd,focal loss,dssd 3.fast-rcnn,faster-rcnn,r-fcn,Light-Head R-CNN,R-FCN-3000 at 30fps,mask-rcnn 4.fpn,pavnet, 5.resenet,d
阅读全文
摘要:https://www.sohu.com/a/168738025_717210 https://www.cnblogs.com/lillylin/p/6207292.html https://blog.csdn.net/a8039974/article/details/77592395
阅读全文