几种归一化方法的概念及python实现

一　(0,1)标准化：

这是最简单也是最容易想到的方法，通过遍历feature vector里的每一个数据，将Max和Min的记录下来，并通过Max-Min作为基数（即Min=0，Max=1）进行数据的归一化处理：

在这里插入图片描述
python的代码实现：

#-*-coding:utf-8-*- 
import numpy as np

def MaxMinNormalization(x,Max,Min):
    x = (x - Min) / (Max - Min);
    return x;

a = np.array([[1,2,3],[4,5,6]])
print(MaxMinNormalization(a,3,0))

二　Z-score标准化：

这种方法给予原始数据的均值（mean）和标准差（standard deviation）进行数据的标准化。

经过处理的数据符合标准正态分布，即均值为0，标准差为1，这里的关键在于复合标准正态分布，个人认为在一定程度上改变了特征的分布，关于使用经验上欢迎讨论，转化函数为：

在这里插入图片描述

这里一样，mu（即均值）用np.average()，sigma（即标准差）用np.std()即可.

python的源码实现:

'''
遇到问题没人解答？小编创建了一个Python学习交流QQ群：579817333 
寻找有志同道合的小伙伴，互帮互助,群里还有不错的视频学习教程和PDF电子书！
'''
def Z_ScoreNormalization(x,mu,sigma):
    x = (x - mu) / sigma;
    return x;


b = np.array([[1,2,3],[4,5,6]])
print(Z_ScoreNormalization(b,b.mean(),b.std()))

三　Sigmoid函数

Sigmoid函数是一个具有S形曲线的函数，是良好的阈值函数，在(0, 0.5)处中心对称，在(0, 0.5)附近有比较大的斜率而当数据趋向于正无穷和负无穷的时候，映射出来的值就会无限趋向于1和0.

个人非常喜欢的“归一化方法”，之所以打引号是因为我觉得Sigmoid函数在阈值分割上也有很不错的表现，根据公式的改变，就可以改变分割阈值，这里作为归一化方法，我们只考虑(0, 0.5)作为分割阈值的点的情况：

在这里插入图片描述

python 源码：

def sigmoid(X,useStatus):
    if useStatus:
        #return 1.0 / (1 + np.exp(-float(X)))
        return 1.0 / (1 + np.exp(-X))
    else:
        return float(X)

c = np.array([[1,2,3],[4,5,6]])
print(sigmoid(c,1))

posted @ 2022-10-07 20:37 I'm_江河湖海阅读(331) 评论(0) 收藏举报

刷新页面返回顶部

I'm_江河湖海

几种归一化方法的概念及python实现

公告