pandas归一化操作

归一化操作有两种

1.max和min的归一化操作

min-max标准化(Min-Max Normalization)

返回结果0~1

公式:

实例:

如:

随机生成假数据如下

df = DataFrame({"height":np.random.randint(150,190,size=50),
"weight":np.random.randint(40,90,size = 50),
"sex":np.random.randint(0,2,size = 50)})
df

对数据进行归一化操作

df = (df-df.min())/(df.max()-df.min())
df

 

df.info()     #函数info()是对我们dataform中的数据进行说明

信息如下

 

df.describe()         #describe()是根据每一列对数据进行汇总

 

2.Z-score标准化方法

方法:

返回结果:返回的结果是标准值为1,平均值为0,标准的正态分布数据

实例如下:

df2 = (df-df.mean())/df.std()           #df数据减去df平均值,再出去df的标准差就是归一化,归一化后标准差值为1
df2

df2.describe()

 

posted @ 2019-01-16 19:52  石桥浪子  阅读(19483)  评论(0编辑  收藏  举报