pandas归一化操作
归一化操作有两种
1.max和min的归一化操作
min-max标准化(Min-Max Normalization)
返回结果0~1
公式:
实例:
如:
随机生成假数据如下
df = DataFrame({"height":np.random.randint(150,190,size=50),
"weight":np.random.randint(40,90,size = 50),
"sex":np.random.randint(0,2,size = 50)})
df
对数据进行归一化操作
df = (df-df.min())/(df.max()-df.min())
df
df.info() #函数info()是对我们dataform中的数据进行说明
信息如下
df.describe() #describe()是根据每一列对数据进行汇总
2.Z-score标准化方法
方法:
返回结果:返回的结果是标准值为1,平均值为0,标准的正态分布数据
实例如下:
df2 = (df-df.mean())/df.std() #df数据减去df平均值,再出去df的标准差就是归一化,归一化后标准差值为1
df2
df2.describe()