机器学习之随笔
以下全部是自己理解。。。希望大神们可以给予指导,万勿喷我,,玻璃心。。谢谢!
1.什么是手动标注?
人为的对数据进行手动标注,给予其“类标号”
2.什么是ground truth?
就是数据的真是类标号、标签。
3.什么是监督?
就是数据有自己的真实类标号。
4.什么是无监督?
数据没有自己的真实的类标号。
5.什么是半监督?
有的数据有标号,有的没有标号。(需要用到聚类,将那些没有标号的通过聚类,给予其标号)
6.什么是弱监督?
比如对于视频来说,如果我们将视频分段clip,那么并不是每一个clip都有类标号,但是对于整体的视频,它是由类标号的。
其实弱监督包括半监督学习与多标记学习。
7.什么是BoVW?
实际上就是BoW。
链接于
http://blog.csdn.net/allyli0022/article/details/44245375
8.协方差?
协方差矩阵的对角线的元素表示的是各个维度的方差,而非对角线上的元素表示的是各个维度之间的相关性,因此,在PCA中,我们尽量将非对角线上的元素化为0,即将矩阵对角化,选特征值较大的维度,去掉特征值较小的维度,来获得主方向,并且使主方向与其他方向的相关性尽量小。
9.Harris角点检测?
在我们解决问题时,往往希望找到特征点,“特征”顾名思义,指能描述物体本质的东西,还有一种解释就是这个特征微小的变化都会对物体的某一属性产生重大的影响。而角点就是这样的特征。
观察日常生活中的“角落”就会发现,“角落”可以视为所有平面的交汇处,或者说是所有表面的发起处。假设我们要改变一个墙角的位置,那么由它而出发的平面势必都要有很大的变化。所以,这就引出了图像角点的定义
“如果某一点在任意方向的一个微小变动都会引起灰度很大的变化,那么我们就把它称之为角点” 。引用于TiffanyZhou的harris角点检测算法。
关于角点的具体描述可以有几种:
1.一阶导数(即灰度的梯度)的局部最大所对应的像素点;
2.两条及两条以上边缘的交点;
3.图像中梯度值和梯度方向的变化速率都很高的点;
4.角点处的一阶导数最大,二阶导数为0,指示物体边缘变化不连续的方向。