本人常用资源整理(ing...)
摘要:Deep Learning(深度学习):ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞pytho...
阅读全文
posted @
2012-05-24 08:32
tornadomeet
阅读(45173)
推荐(41) 编辑
Reading papers_9(与object recognition相关,ing...)
摘要:1. 读Leibe, B., A. Leonardis, et al. (2004). Combined object categorization and segmentation with an implicit shape model. ECCV. 本文提出的算法名为ISM,其集成识别和分割方法到一个普遍的概率框架中。为了得到好的分割效果,该算法能够产生一个基于每个像素的信任图,该信任图能够体现假设的支持度和真实度,通过该信任图能够处理一个场景中多个目标以及用基于MDL准则解决目标假设重叠的问题。 其识别的流程是首先用常见的特征点检测算子检测出图片的特征点,且以特征点为中心抽取出...
阅读全文
posted @
2012-05-21 20:07
tornadomeet
阅读(1648)
推荐(0) 编辑
Reading papers_8(与图像特征点检测相关,ing...)
摘要:1.读Harris, C. and M. Stephens (1988). A combined corner and edge detector, Manchester, UK. 本文提出的算法可以同时检测出边缘和角点,其角点检测算子名为Harris,用的是作者的名字命名,可见其应用之广。 作者首先指出计算机视觉对3维世界的理解离不开图像的特征检测和跟踪,随后又指出边缘信息检测和跟踪存在很多问题,不太适合理解3维真实世界,所以作者把工作重心放在特征点的检测和跟踪上。 本文特征点和边缘检测的思想很简单,其思想来源于前人Moravec的角点检测算法。即用一个小的窗口在像素点周围移动,如...
阅读全文
posted @
2012-05-17 10:49
tornadomeet
阅读(2005)
推荐(1) 编辑
总结系列_5(opencv知识点,续...)
摘要:1. 得到Mat类型img的size,可以使用函数img.size(),注意这里有括号。但是在需得到img的行和列时,不需要使用括号,即使用img.rows和img.cols. 2. 已经定义好了img为Mat型,但是没有初始化,在后面程序的任何一个位置可以使用下面的代码初始化img,比如img=Mat(***1,***2),其中***1是矩形区域的大小,***2是数组内数据类型。 3. 在opencv中像素点的数据类型能找到对应类似char,int,float,double的,比如说是分别为CV_8UC1,CV_16UC1,CV_32FC1, CV_64FC1,一定要注意是没有这一说...
阅读全文
posted @
2012-05-14 00:07
tornadomeet
阅读(6699)
推荐(2) 编辑
Reading papers_7(与human activity recognition特征提取相关,ing...)
摘要:1.读Dollár, P., V. Rabaud, et al. (2005). Behavior recognition via sparse spatio-temporal features, IEEE. 本文作者提出了检测视频数据特征点,即spatio-temporal特征,即时空特征点,并将该特征应用于行为识别,且在前提假设比较少的情况下提出了一个人体特征检测和行为识别的通用框架。 行为识别的研究途径有以下几种:通过恢复视频中人体的位置和姿态,但是模型匹配很难做到准确;通过跟踪空间特征点轨迹来进行识别;通过不断的重复跟踪来对人体进行行为识别;通过检测时空特征点来进行行为识别。
阅读全文
posted @
2012-05-10 23:31
tornadomeet
阅读(3166)
推荐(0) 编辑
Reading papers_6(Pattern Recognition And Machine Learning一书,ing...)
摘要:第一章,引论 本章是本书的纲领,有着统领全局的味道。 首先通过一个多项式曲线拟合的例子引出了本领域的一些概念,比如线性模型,过拟合,错误函数,模型比较和模型选择,最大似然,正则化,岭回归,权值衰减,验证集,hold-out集等。 然后作者分别从概率理论,决策理论,信息理论三个方向分别介绍了这几个理论在模式识别和机器学习中的作用。本书也是由这3个理论贯穿的,其中最终要的理论是概率理论。(待续…)第二章,概率分布
阅读全文
posted @
2012-05-10 21:41
tornadomeet
阅读(1854)
推荐(0) 编辑
目标跟踪学习笔记_3(particle filter初探2)
摘要:上次已经初步体验了下particle filter,直接用别人的代码,见我前面的博文http://www.cnblogs.com/tornadomeet/archive/2012/03/18/2404817.html 一开始是内存出错,后面干脆自己学了下particle filter滤波的原理,把代码认真看了一遍,然后自己从头敲了遍代码,虽然运行时不再出现内存溢出等bug,但是没有跟踪效果。 这次的代码和上次一样,有跟踪效果,不过不理想。依旧是参照博主:http://blog.csdn.net/yang_xian521/article/details/6928131 的代码,但是算法稍...
阅读全文
posted @
2012-05-08 23:11
tornadomeet
阅读(6134)
推荐(1) 编辑
基础学习笔记之opencv(5):实现鼠标选定矩形框
摘要:opencv编写程序中,用鼠标选定矩形框经常用到。编程时看似很简单的逻辑思路,如果对opencv中的Rect不是很了解的话,那实现的效果就不是特别理想,比如说虽然我们习惯性用鼠标从左上到右下选择,但是偶尔也会从左下到右上选择等等…… 开始自己实现这个功能后,发现写的代码比较繁琐,if语句太多。后面看了opencv的例程后,感觉它的代码效率非常高。下面就是用来练习下的。 环境:opencv2.3.1+vs2010 功能:打开摄像头,捕捉视频图像,用鼠标选定视频区域(支持各种选择习惯)。 代码和注释如下: 1 #include "stdafx.h" 2 #include &qu
阅读全文
posted @
2012-05-04 21:58
tornadomeet
阅读(14936)
推荐(1) 编辑
基础学习笔记之opencv(4):直方图使用学习
摘要:目的: 直方图在cv领域到处可见,因为其功能在cv算法的实现中必不可少。Opencv库中也集成了关于直方图的不少函数,比如直方图的计算,均衡,归一化,相似度比较等等。为了体验这些函数,做了个小实验,功能是:打开摄像头,鼠标选定一个框,框内图像作为标准图像,计算出其直方图并显示出来;然后继续鼠标选定框,该框内的图像的直方图与标准图像的进行相似度计算,计算结果在终端输出,数值越大表示相似度越大。 工程环境:opencv2.3.1+vs2010。工程代码: 1 // hist_test.cpp : 定义控制台应用程序的入口点。 2 // 3 4 #include "stdafx.h&quo
阅读全文
posted @
2012-05-03 16:39
tornadomeet
阅读(27101)
推荐(2) 编辑
Reading papers_5(与human activity analysis综述相关,ing...)
摘要:读Poppe, R. (2010). "A survey on vision-based human action recognition." Image and Vision Computing 28(6): 976-990. 这篇文章写的是关于人体动作识别的综述类文章,论文中没有对某个具体的模型或算法做详细的描述,只是将其分类到作者框架下动作识别的一个研究方向。 在本篇论文的参考文献中,作者也列出了比较出名的此类综述性文章,但是每篇综述性文章的写作线索都不尽相同,这是因为每个学长对human action recognition的理解不完全相同。 本领域的一些难点和特点
阅读全文
posted @
2012-05-01 22:37
tornadomeet
阅读(1215)
推荐(0) 编辑
Reading papers_4(与particle filter相关,ing...)
摘要:读Isard, M. and A. Blake (1998). "Condensation—conditional density propagation for visual tracking." International journal of computer vision 29(1): 5-28. 在目标跟踪领域中,kalman跟踪有着先天的不足,因为它是基于单模高斯分布的,不能同时表示多目标。而condensation算法使用了重采样技术,目标的概率分布通过随机产生的数据集来表示,然后使用已知的动态模型和观察模型来传播这些随机数据集。实验最后显示这个算法对快速运动
阅读全文
posted @
2012-05-01 21:44
tornadomeet
阅读(1146)
推荐(0) 编辑
Reading papers_3(与mean shift相关,ing...)
摘要:读Comaniciu, D. and P. Meer (2002). "Mean shift: A robust approach toward feature space analysis." Pattern Analysis and Machine Intelligence, IEEE Transactions on 24(5): 603-619. 本文分析的算法mean shift是属于一种非参数算法,可以被用来分析复杂的多模态特征空间以及视觉领域的一些其它难题。 文章明确给出了mean shift的定义和计算方法。先将非参数密度估计用核函数表示,然后对其求导,通过引
阅读全文
posted @
2012-05-01 21:07
tornadomeet
阅读(1187)
推荐(0) 编辑
Reading papers_2(与GMM相关,ing...)
摘要:读Stauffer, C. and W. E. L. Grimson (1999). Adaptive background mixture models for real-time tracking, IEEE. 这篇文章首次将GMM模型引入cv领域中,提供了一个用背景减图法进行于前景检测的背景建模方法。文章中将每一个像素点都建立一个混合高斯模型(即用多个高斯来描述该像素点),并且能够在线近似更新该点的模型。训练阶段,当建立了多个高斯时,这些混合高斯的分布将会被评估决定哪些高斯最有可能代表背景模型。在检测阶段,将会计算每个像素点的值与混合高斯中高斯的相似度,如果到达预定阈值,则认为属于背景.
阅读全文
posted @
2012-05-01 20:24
tornadomeet
阅读(1738)
推荐(0) 编辑
前景检测算法_2(帧差法1)
摘要:帧差法是背景减图法中的一种,只不过是帧差法不需要建模,因为它的背景模型就是上一帧的图,所以速度非常快,另外帧差法对缓慢变换的光照不是很敏感,所以其用途还是有的,有不少学者对其做出了出色的改进。 其基本原理可以用下面公式看出: |i(t)-i(t-1)|<T 背景 |i(t)-i(t-1)|>=T 前景 其中i(t),i(t-1)分别为t,t-1时刻对应像素点的像素值,T为阈值。 当然其缺点也不少,容易出现”双影”和”空洞”现象。 用opencv2.3.1+vs2010做了个简单的实验,其实验代码如下: 1 // frame_diff.cpp : 定义控制台应用程序的入口点。 2..
阅读全文
posted @
2012-05-01 09:28
tornadomeet
阅读(31214)
推荐(5) 编辑