随笔分类 - PatternRecognition
模式识别算法
摘要:1.信息熵 给定概率密度函数\(p(x)\), 定义该函数的信息熵 \(H(p)=H[\mathbf{x}]=-\int{p(\mathbf{x})lnp(\mathbf{x})d\mathbf{x}}\) 信息熵描述了分布的混乱程度。均匀分布是使得信息熵最大的概率分布。单点的冲击响应函数对应的信息
阅读全文
摘要:机器视觉中,3D相机产生的深度图像(depth image)通常需要配准(registration),以生成配准深度图像(registed depth image)。实际上配准的目的就是想让深度图和彩色图重合在一起,即是将深度图像的图像坐标系转换到彩色图像的图像坐标系下。下面我们来介绍其推导的过程。
阅读全文
摘要:深度图转点云的计算过程很简洁,而里面的原理是根据内外参矩阵变换公式得到,下面来介绍其推导的过程。 1. 原理 首先,要了解下世界坐标到图像的映射过程,考虑世界坐标点M(Xw,Yw,Zw)映射到图像点m(u,v)的过程,如下图所示: 详细原理请参考教程"相机标定(2) 摄像机标定原理",这里不做赘述。
阅读全文
摘要:libsvm很早之前就用了,现在封装一下方便自己使用,也方便大家更快的使用这个库,这个库一个挺有用的特性就是对测试样本的概率估计。源码在随笔的最后。liblinear的版本也是类似移植,主要是处理好数据的传入即可。 1.源码 码农最喜欢的稻草了,封装的项目源码,请看附件:CxLibSVM.zip l
阅读全文
摘要:这\(^{[1]}\)是一篇关于如何使用高维度特征在人脸验证中的文章,作者以主要LBP为例子,论述了高维特征和验证性能存在着正相关的关系,即人脸维度越高,验证的准确度就越高。由于那时候没有用DeepLearning在LAWF上测试精度就能达到很高的精度95+%,受到了很多人的关注。而有些开源库已经实
阅读全文
摘要:欧拉角和四元数都可以用来描述物体的姿态。欧拉角的万向节死锁理解稍微奇怪。四元数原理的理解较为复杂。欧拉角和四元数之间可以做转换。这里收集了若干资料已做备忘。 万向节死锁(Gimbal Lock) : 欧拉角中的万向节死锁(Gimbal Lock)是一个重点和难点,理解了它对理解为何使用四元数替代欧拉
阅读全文
摘要:利用Landmarks进行人脸对齐裁剪是人脸检测中重要的一个步骤。效果如下图所示: 基本思路为: a.人脸检测 人脸的检测不必多说了,基本Cascade的方式已经很不错了,或者用基于HOG/FHOG的SVM/DPM等。这些在OpenCV,DLIB都有。 b.在检测到的人脸上进行Landmarks检测
阅读全文
摘要:1、运行环境配置 2、安装skeltrack 3、ROS和Skeltrack对接 有位作者写了一个-skeltrack开源包,地址:https://github.com/jmerdich/ros-skeltrack.git 但是运行不起来,无法跟踪,需要修改下输入的图像参数,不用异步的方式,用同步的
阅读全文
摘要:粒子滤波器是贝叶斯滤波器的一种非参数执行情况,且经常用于估计一个动态系统的状态。粒子滤波器的关键思想是采用一套假设(即粒子)来表示后验概率,其中每一个假设代表了这个系统可能存在的一种潜在状态。状态假设表示为一个有 \( N \) 个加权随机样本的集合 \(S \) : \( S=\left \{ <
阅读全文
摘要:最近学习slam用到粒子滤波,重温其思想和原理。收集了一些不错的入门资料,以做备忘。 参考资料 [1].用放狗的方式理解粒子滤波。
阅读全文
摘要:该论文是一篇来自CMU 的CVPR2013文章,提出了一种基于稀疏编码的轮廓特征,简称HSC(Histogram of Sparse Code),并在目标检测中全面超越了HOG(Histogram of Gradient)本文介绍HSC的思路及其计算过程。如图3所示,HSC方法种采用了疏编码原理来提...
阅读全文
摘要:EM(Expectation Maximization)算法参考资料:[1].从最大似然到EM算法浅解[2]. 简单的EM算法例子[3].EM算法)The EM Algorithm(详尽的理论推导过程,源自斯坦福大学的教程)[4].混合高斯模型(Mixtures of Gaussians)和EM算法
阅读全文
摘要:很有意思的一篇人脸识别算法文章,人家写的太好,就不好意思写了,收集了一些资料,包括了原理介绍,流程图,项目网址和作者主页信息等。参考资料:[1].http://blog.csdn.net/csyhhb/article/details/46300001(原理介绍)[2].http://blog.csd...
阅读全文
摘要:最近因为需要收集了一些OCR的供应商,可以做身份证识别,银行卡识别,名片识别等特定场景下的文字识别。在通用场景下的文字识别效果还不是很理想。现在OCR在特定的场景下做得已经很不错了。下面列出下这些厂商及其相应的演示链接。1、文通(http://www.wintone.com.cn/a/prods/n...
阅读全文
摘要:近些年国内的人脸技术已经得到了很大的发展,今天网上无意看到了微软和face++两家公司的人脸检测,Face++号称国际顶尖的技术,也用过他们的接口感觉确实很不错,而微软则不再话下了。于是想对比微软和Face++的人脸检测效果。1、演示接口以官方提供的在线测试接口为准:微软:https://cn.pr...
阅读全文
摘要:这是CVPR2015的一篇非常有趣的文章,论文研究了如何让机器自动地教导学生进行学习目标的分类。论文研发了一种机器学习方法,通过人机交互的过程中,不断的优化机器指导的方法和技巧,从而提高人学习目标分类的效率。如下图所示:机器教导人学习的过程 1、机器首先展示一张图片A给人看,不告诉图片中物体的...
阅读全文
摘要:算法思想:算法通过最小化约束条件4ac-b^2 = 1,最小化距离误差。利用最小二乘法进行求解,首先引入拉格朗日乘子算法获得等式组,然后求解等式组得到最优的拟合椭圆。算法的优点: a、椭圆的特异性,在任何噪声或者遮挡的情况下都会给出一个有用的结果; b、不变性,对数据的Euclidean变换具有...
阅读全文
摘要:最近一直在构想一种简单易用的视觉跟踪系统,思想是基于模板的全自动目标检测跟踪系统,即用户只需要提供一个目标的模板,即可自动的检测出视频中的所有相同的物体,这里包括了不同的缩放尺寸,不同旋转角度和不同的颜色等。这样的算法在工业视觉中会有很广泛的应用价值。接下来一段时间将努力实现之。
阅读全文