Reading papers_16(Learning hierarchical invariant spatio-temporal features for action recognition with independent subspace analysis)
摘要:前言 本次读的文章是与feature learning相关,feature learning也叫做deep learning,是最近一个比较热门的话题。因为它可以无监督的学习到图片和视频的一些特征(当然在其它领域也可以,比如语音,语言处理等),而这些特征并不需要人为手动去设。手动设计的特征,常见的有sift,surf,hog等,它们都是经过了很长的时间才设计出来的,并且它只适应于2D的图片,如果把所需学习的目标换成视频,则也同样需要把这些算法扩展到3D,比如HOG3D,3Dsurf,这个扩展过程也是需要很多技巧和时间的。另外,手动设计的某一特征只对某些数据库表现好,而对其它的数据库效...
阅读全文
posted @
2013-01-04 22:27
tornadomeet
阅读(3790)
推荐(0) 编辑
论文写作心得:1(用Endnote批量处理论文中所需参考文献的格式)
摘要:本文使用的工具是:Endnote X5 如果需要对某一篇论文的所有参考文献按照某一规则排列好,必须先使用Endnote编辑好一种文献Style。这里的步骤是: 1. 打开界面:Edit->Output Styles->Open Styles Manager,如下图所示: 2. 在Name那一列找到与自己所需要Style最相近的那一个选项。因为这里的Style太多,可以选择中间右下角的Find by选择和自己论文相关的领域,比如我这里在Find by里面选择Engineering,显示列表大大减小,如下图所示: 3. 然后点击Edit对该格式进行修改,我这里选择IEEE的St...
阅读全文
posted @
2012-12-20 21:59
tornadomeet
阅读(17845)
推荐(1) 编辑
Reading papers_15(Graph cuts optimization for multi-limb human segmentation in depth maps)
摘要:如果大家有用过kinect做开发,不管是使用kinect SDK还是使用OpenNI,估计都对这些库提供的人体骨骼跟踪技术有一定的好奇,心里在想,每个人穿的衣服不同,身体特点也不同,所处的环境不同,且走路或做手势时的姿势也不相同,竟然能够跟踪人体的骨架,且效果不错。那么上面的Kinect SDK和OpenNI提供给kinect开发的核心算法——人体骨架跟踪到底是怎么实现的呢?CVPR2011的最佳论文就给出了微软SDK的核心算法,见参考文献2,该文章主要是讲的Kinect SDK的人体骨架跟踪核心算法。因为该算法具有普适性,且效果好,被评为best peaper那是必须的。微软算法的流程图..
阅读全文
posted @
2012-12-12 09:46
tornadomeet
阅读(3443)
推荐(1) 编辑
Reading papers_14(关于depth image on hand segmentaion,ing...)
摘要:Real-time fingertip tricking and detection using Kinect depth sensor for a new writing-in-the air system 本文是基于kinect的空中手写字的识别,即用一个手指在空中写字,写完后系统会自动判断出所写的字是哪一个。本人比较感兴趣的不是怎么识别出字体,而是怎样不断的很好的跟踪手指。读过文章发现,作者并不是完全从深度数据或颜色数据开始做的,而是利用OpenNI很多工作,比如OpenNI提供的身体分割图。并且该文章提出的分割和跟踪算法其使用条件也是相当的严格的,即人的手必须在伸出在身体前才能跟...
阅读全文
posted @
2012-11-27 11:13
tornadomeet
阅读(2088)
推荐(1) 编辑
Reading papers_13(gesture recognition survey,ing...)
摘要:1、Mitra, S. and T. Acharya (2007). "Gesture recognition: A survey." Systems, Man, and Cybernetics, Part C: Applications and Reviews, IEEE Transactions on 37(3): 311-324. 这是一篇07年的关于人体姿势识别的综述性文章,不过文章的重点是放在手势识别以及人脸识别的介绍中。作者在介绍姿势识别的应用场合和一些手势识别的分类后,重点是介绍手势和人脸识别的一些模型工具。并且详细介绍了这些模型的基本原理以及这些模型与手势识
阅读全文
posted @
2012-10-31 10:12
tornadomeet
阅读(2224)
推荐(1) 编辑
Reading papers_12(Attention Based Detection and Recognition of Hand Postures Against Complex Backgrounds)
摘要:论文内容介绍: 这是一篇2012年8月份发表在IJCV的文章,文章中主要实现的功能是手势的分割和识别,即对静态图片中10个数字的手势进行识别,这些手势都是处于复杂的背景下。识别算法最后在作者的NUS-II手势数据库中可以达到94%以上的识别率。 文章中主要采用了2个方面的理论,第一个理论是用数学模型来模拟人大脑皮层中与视觉区域有关的部位。神经科学研究发现,人的视觉皮层可以分为5个部分,分别为V1~V5。其中V1属于初级视皮层,V2~V5是纹外皮层。V1,V2完成的是目标检测的功能,V3,V4,V5完成的是目标识别。文章中所用的数学模型理论主要是对大脑视觉皮层模拟的一个简化,这里只是...
阅读全文
posted @
2012-10-26 21:54
tornadomeet
阅读(1653)
推荐(0) 编辑
本人常用资源整理(ing...)
摘要:Deep Learning(深度学习):ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞pytho...
阅读全文
posted @
2012-05-24 08:32
tornadomeet
阅读(45173)
推荐(41) 编辑
Reading papers_7(与human activity recognition特征提取相关,ing...)
摘要:1.读Dollár, P., V. Rabaud, et al. (2005). Behavior recognition via sparse spatio-temporal features, IEEE. 本文作者提出了检测视频数据特征点,即spatio-temporal特征,即时空特征点,并将该特征应用于行为识别,且在前提假设比较少的情况下提出了一个人体特征检测和行为识别的通用框架。 行为识别的研究途径有以下几种:通过恢复视频中人体的位置和姿态,但是模型匹配很难做到准确;通过跟踪空间特征点轨迹来进行识别;通过不断的重复跟踪来对人体进行行为识别;通过检测时空特征点来进行行为识别。
阅读全文
posted @
2012-05-10 23:31
tornadomeet
阅读(3166)
推荐(0) 编辑