摘要:
数据预处理在众多深度学习算法中都起着重要作用,实际情况中,将数据做归一化和白化处理后,很多算法能够发挥最佳效果。当我们开始处理数据时,首先要做的事是观察数据并获知其特性。本部分将介绍一些通用的技术,在实际中应该针对具体数据选择合适的预处理技术。例如一种标准的预处理方法是对每一个数据点都减去它的均值(也被称为移除直流分量,局部均值消减,消减归一化),这一方法对诸如自然图像这类数据是有效的,但对非平稳... 阅读全文
摘要:
kmeans是数据挖掘领域最为常用的聚类方法之一,最初起源于信号处理领域。它的目标是划分整个样本空间为若干个子空间,每个子空间中的样本点距离该空间中心点平均距离最小。因此,kmeans是划分聚类的一种。方法简单易懂,也很有说服力。但,不幸的是,这是一个NP-hard问题。首先来看一下NP问题。NP即Non-Deterministic polynomial,非确定性多项式。这里隐含着两个概念,即多项... 阅读全文