机器学习中(Feature Scaling)特征缩放处理的matlab实现方式

在进行特征缩放的时候,其一般做法是(X-mu)/sigma

mu:代表均值

sigma:代表标准差

在matlab中,函数mean可以求特征的均值,函数std可以求特征的标准差。

假设训练集为m,特征数量为n,特征矩阵为X,则X的size为 m*n。

则 mu = mean(X)返回值为一个1*n的向量,向量中每个值对应于每个特征的均值。

则 sigma = std(X) 返回值为一个1*n的向量,向量中每个值对应于每个特征的标准差。

为了进行特征缩放,我们需要使用matlab中另外一个函数repmat。

对于repmat函数,可以理解成Repeat Matrix .

官方帮助文档为:

  Repeat copies of array。

B = repmat(A,n) returns an array containing n copies of A in the row and column dimensions. The size of B is size(A)*n when A is a matrix.

repmat(A, n)表示分别在行和列上对于矩阵A拷贝n分。

例如:

A= 

2 3;

3 4

则B = repmat(A, 2);

B =

2 3 2 3
3 4 3 4
2 3 2 3
3 4 3 4

repmat(A, m, n)表示在列方向返回m个A的拷贝,在行方向返回n个A的拷贝。

B = repmat(A, 2, 1)

B = 

2 3
3 4
2 3
3 4

对于实现特征缩放,可以使用repmat函数来实现,由以上的计算可知:

X 为 m*n 矩阵

mu 1*n 向量

sigma 1*n向量

为了对X中的每一列向量进行特征缩放,使用以下命令即可

X_norm = (X - repmat(mu,size(X,1),1)) ./ repmat(sigma,size(X,1),1);

即,首先将mu使用premat函数为m*n向量,本质为将m个mu向量,按行叠加成矩阵。

X - repmat(mu, size(X,1), 1) 

即为X-mu的特征缩放。

对于(X-mu)/sigma的处理方式一样。

 

posted @ 2016-10-16 14:24  ~Oo_oO~  阅读(2003)  评论(0编辑  收藏  举报