班课3
1. 进行特征提取是因为如果直接对pixels进行操作,因为很多时候pixel与pixel之间变化不大,所以冗余的计算会很多
2. feature types主要分为三种,分别为colour features,texture features以及shapefeatures
features需要满足尺度不变性及旋转不变性
colour features是计算最简单的一个,colour histogram可以将其量化(用RGB分开成三张),另一种表示方法为colour moments (first-order moment, second-order moment,third-order moment)
texture features为纹理特点,变化剧烈容易捕捉,Haralick Features对高维度的数据进行分析,将接近的点进行压缩从而进行降维(首先创建GLCM,即灰度空间矩阵,然后根据对其计算从而对texture进行描述)
P(a, b)中,a表示的是距离,b表示的是度数,后面的matrix则想象成一个表格,以第一个为例,左上角为有几个0的旁边也是0的情况(因为距离1,度数0),图中00在一起的出现了两次,左右两个方向所以一共四次。然后根据不同方法从而计算特征,如ASM可以反应纹理的均匀程度及粗细程度,entropy反应纹理复杂程度
3. Local binary patterns: 对中心点周围的点重新进行赋值,原始点比中心点小即为0,其他则为1
对于高分辨率也可以进行圆周采样,且由于旋转不变性,我们可以将通过圆周LBP的数字进行一位位的右移,调整成最小的数字,由于有些数字调整之后会得到一样的数字,从而减少需要考虑的情况
增强型旋转不变性则是指通过计算出现0到1或者1到0变化的次数而进一步进行分类的方法
4. SIFT
a) 尺度空间极值检测:find maxima/minima in DoG images across scales
b) 给keypoints分配一个或多个方向
c)用gradient orientation histogram描述keypoint
Gaussian是唯一一个可以保证尺度不变性的函数
找到keypoint之后要去除低对比度的点(因为图像为离散数值,所以找到的极值点不一定为真正的极值点),hessian可以去掉edge
histogram里横坐标表示度数(8bins意味着360°要分成8份),占比最大的为主方向(dominant orientation)
5. Descriptor Matching:NNDR是用来算距离的,SIFT的应用是找到两个图的keypoints,从而将两个图片拼在一起
6. 笛卡尔坐标系与极坐标系的转换,如(a,b,w)转为笛卡尔就是(a/w, b/w),故而要表示无穷远可以将w设为很小,如0
transformation中的scale是比例变化,PPT中为笛卡尔表示,其中Sx Sy为分别对x y进行变化,而projective中的i是对整体进行变化,cf是投影
7. r theta表示法:如y=ax+b上两个点分别表示为r=x0cos(theta0)+y0sin(theta0)
以及r=x1cos(theta1)+y0sin(theta1),从而将直线表示为两个cos sin曲线的交点
同时y=3这种直线不好用y=kx+b表示,也可以转变成胡夫变换
8. RANSAC fitting:正态分布很适合用least-square,因为很好拟合,但是这种方法容易被noise干扰,故而可以使用迭代算法RANSAC,随机选择一个子集,然后尝试进行拟合,再根据其他的点判断拟合的正确性,正确性低时重新找新的子集,如果有合适的点就扩充子集
9. 要进一步对feature进行encoding,即将单个空间拟合到别的空间里,如BoW
第一步其中一个步骤是clustering,这个步骤的方法有k-means,即有k个类别
转成histogram