python 中,实现对数据集的归一化(0-1之间)
多数情况下,需要对数据集进行归一化处理,再对数据进行分析
#首先,引入两个库 ,numpy,sklearn
from sklearn.preprocessing import MinMaxScaler
import numpy as np
#将csv文件导入矩阵当中
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
#将数据集进行归一化处理
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)
#最后的my_matrix_normorlize 实现了归一化my_matrix_normorlize
完整未解释代码:
from sklearn.preprocessing import MinMaxScaler
import numpy as np
my_matrix = np.loadtxt(open("xxxx.csv"),delimiter=",",skiprows=0)
scaler = MinMaxScaler( )
scaler.fit(my_matrix)
scaler.data_max_
my_matrix_normorlize=scaler.transform(my_matrix)