Austin_anheqiao - 博客园

2019年8月17日

摘要：通过特征提取，我们能得到未经处理的特征，这时的特征可能有以下问题：一、无量纲化无量纲化使不同规格的数据转换到同一规格。常见的无量纲化方法有标准化和区间缩放法。标准化的前提是特征值服从正态分布，标准化后，其转换成标准正态分布。区间缩放法利用了边界值信息，将特征的取值区间缩放到某个特点的范围，例如阅读全文

posted @ 2019-08-17 15:37 Austin_anheqiao 阅读(392) 评论(0) 推荐(0) 编辑

3、特征清洗

摘要： 1、清洗去除脏的数据，比如某些商品的刷单数据，缺省值多的数据，异常数据，一般情况下直接舍弃。结合业务情况比如去除crawler抓取，spam，作弊等数据采用异常点检测算法偏差检测：聚类、最近邻等基于统计的异常点检测：例如极差，四分位数间距，均差，标准差等。基于距离的异常点检测：与大多数阅读全文

posted @ 2019-08-17 15:11 Austin_anheqiao 阅读(934) 评论(0) 推荐(0) 编辑

2、特征获取

摘要：互联网公司里大部分复杂的模型都是极少数的数据科学家在做，大多数工程师们做的事情基本是在数据仓库里搬砖，不断地数据清洗，再一个是分析业务不断地找特征。特征的来源有两部分，（1）业务已经整理好的各种特征数据，我们去寻找适合我们问题需要的特征；（2）我们从业务特征中寻找高级的数据特征。对于业务已经整理阅读全文

posted @ 2019-08-17 14:58 Austin_anheqiao 阅读(299) 评论(0) 推荐(1) 编辑

1、特征工程

摘要：特征工程是机器学习中最耗时、最繁重的部分。非常重要。数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。特征工程的目的：将信息使用更加高效的编码方式（特征）表示，信息损失最小，原始数据中包含的规律仍然存在。这种新的编码方式要尽量减少原始数据中的不确定因素（噪声、异常数据、数据缺失等阅读全文

posted @ 2019-08-17 14:46 Austin_anheqiao 阅读(275) 评论(0) 推荐(1) 编辑

特征提取算法（3）——SIFT特征提取算子

摘要：目录：前言 1、高斯尺度空间GSS 2、高斯差分DOG 用DoG检测特征点 GSS尺度选择 3、图像金字塔建立用前一个octave中的倒数第三幅图像生成下一octave中的第一幅图像每层octave为什么生成s+3幅图像 4、高斯核性质在SIFT中的应用 5、除去不好的特征点 6、给特征点赋值阅读全文

posted @ 2019-08-17 14:40 Austin_anheqiao 阅读(4952) 评论(0) 推荐(1) 编辑

2019年8月15日

特征提取算法（2）——HOG特征提取算法

摘要： histogram of oriented gradient（方向梯度直方图）特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中，尤其在行人检测中获得了极大的成功。需要提醒的是阅读全文

posted @ 2019-08-15 22:13 Austin_anheqiao 阅读(1334) 评论(0) 推荐(0) 编辑

特征提取算法（1）——纹理特征提取算法LBP

摘要：模式识别中进行匹配识别或者分类器分类识别时，判断的依据就是图像特征。用提取的特征表示整幅图像内容，根据特征匹配或者分类图像目标。常见的特征提取算法主要分为以下3类：基于颜色特征：如颜色直方图、颜色集、颜色矩、颜色聚合向量等；基于纹理特征：如Tamura纹理特征、自回归纹理模型、Gabor变换、阅读全文

posted @ 2019-08-15 21:55 Austin_anheqiao 阅读(8966) 评论(1) 推荐(0) 编辑

图像梯度

摘要：一、梯度不是一个实数，他是一个向量即有方向有大小。以一个二元函数来讲解，设一个二元函数f(x,y)，在某个点的梯度为： = ：称为向量微分算子或nabla算子梯度的方向是函数变化最快的方向，沿着梯度的方向容易找到最大值。二、图像梯度模糊图像中的物体轮廓不冥想，轮廓边缘灰度变化不强烈，层次感不阅读全文

posted @ 2019-08-15 16:20 Austin_anheqiao 阅读(8844) 评论(2) 推荐(1) 编辑

2019年8月12日

插值算法

摘要：用于图像缩放。 1、最近邻插值算法（零阶插值算法）目标图像B（X,Y）通过同时求得源图像A（x+u,y+v）（u，v是<=1的小数），则对应在源图像上的坐标为A（x,y）=A（i,j）,所以要找邻近的4个像素点：如果 i+u, j+v(i落在 A区，即 u<0.5,v<0.5，则将左上角象素的灰阅读全文

posted @ 2019-08-12 22:13 Austin_anheqiao 阅读(4284) 评论(0) 推荐(1) 编辑

边缘检测

摘要：目录 1、介绍 2、一般步骤 3、canny算子 4、sobel算子 5、拉普拉斯算子 6、scharr滤波器 1、介绍边缘检测也是一种滤波，不同的算子有不同的提取效果。比较常用的算子是canny、soble、Laplacian 2、一般步骤 1、滤波边缘检测的算法主要是基于图像强度的一阶和二阶阅读全文

posted @ 2019-08-12 16:30 Austin_anheqiao 阅读(4111) 评论(0) 推荐(0) 编辑

keep going!~

苦尽甘来定不负生而善之

公告

keep going!~

苦尽甘来 定不负生而善之

公告

苦尽甘来定不负生而善之