2019年6月23日

摘要: 1、对图像进行按照独立通道进行拆分 b,g,r = cv2.split(img) #涉及到opencv的图像读取是以bgr形式来做的 img = cv2.merge(b,g,r) #对图像进行按通道混合或者使用numpy索引(注:numpy索引的耗时更短)b=img[:,:,0]2、图像边缘填充,paddingcv2.copyMakeBorder()3、图... 阅读全文
posted @ 2019-06-23 12:30 胖咸鱼 阅读(814) 评论(0) 推荐(0) 编辑
摘要: 学习一下convLSTM的相关论文,这篇论文是第一次提出ConvLSTM的论文,然后ConvLSTM就成了Keras的一个轮子。通过对原有的全连接LSTM进行改进,提出了一个卷积LSTM。虽然他们的方法有一定的成效,但是他们用的是FC-LSTM,没有把序列的空间性列入考量。(换言之,ConvLSTM可以对序列的空间性进行考量, 即有对周围感知的能力的时间序列LSTM,激动!)我们用多层LSTM进行... 阅读全文
posted @ 2019-06-23 12:29 胖咸鱼 阅读(2089) 评论(0) 推荐(0) 编辑
摘要: 这篇文章是对ROLO的代码解读。首先是对单目标跟踪的实现,参考博客中的说法,主要阅读的文件有三个,接下来分别进行阅读。YOLO_network.py从代码中可以看到最终的输出是 7*7*(5*2+20),中间全连接层的输出是4096个,最终的输出位置信息是[c,x,y,w,h,p],这些都存储在yolo_out中,是以numpy方法中的.NPY文件argv_parser函数是对在调用这个py文件时... 阅读全文
posted @ 2019-06-23 12:10 胖咸鱼 阅读(499) 评论(0) 推荐(0) 编辑
摘要: 这篇博文是对ROLO的学习笔记,包括paper阅读笔记和代码学习记录。代码和paper地址在另一篇综述博文中点明,这里不再赘述。1、论文阅读摘要部分文章受到了用回归方法生成bounding box(边界框)的思路启发,探索在时间域进行回归的能力,研究了将卷积生成的高维视觉信息与LSTM的时间维度能力相结合,获得了更优的跟踪表现。在网上能搜到的关于ROLO的博客很少,基本上没人关注这个方向,应该是产... 阅读全文
posted @ 2019-06-23 12:04 胖咸鱼 阅读(1070) 评论(1) 推荐(0) 编辑

导航