爽歪歪666
不以物喜,不以己悲,努力才是永恒的主题。

在训练集和测试集数据预处理时,需要对数据进行标准化

训练集使用fit_transform

测试集使用transform

例如:

StandardScaler类是一个用来讲数据进行归一化和标准化的类

1 from sklearn.preprocessing import StandardScaler
2 ss_x = StandardScaler()
3 x_train = ss_x.fit_transform(x_train)
4 x_test = ss_x.transform(x_test)

transform和fit_transform的区别

标准化公式

fit_transform方法是fit和transform的结合,fit_transform(X_train) 意思是找出X_train的\mu\sigma,并应用在X_train上。
这时对于X_test,我们就可以直接使用transform方法。因为此时StandardScaler已经保存了X_train的
\mu\sigma
参考链接:

 

posted on 2019-12-26 16:55  爽歪歪666  阅读(2287)  评论(0编辑  收藏  举报